จงยกกรณีตัวอย่างการใช้ big data ในประเทศไทย

โดย ปาลิต วรพงศ์พิบูลย์

เราคงคุ้นชินกับคำว่า Big Data กันมาพอสมควร แต่ถ้าให้ลงลึกไปในรายละเอียดอาจทำให้ปวดหัวได้เช่นกัน

 ถ้าให้อธิบายแบบง่ายๆ คือ ปริมาณข้อมูลที่มาก มีความซับซ้อน โดยเฉพาะที่มาจากแหล่งข้อมูลใหม่ๆ ด้วยปริมาณที่มากมายมหาศาลทำให้ไม่สามารถประเมินและวิเคราะห์ด้วยวิธีการ ซอฟต์แวร์ ฮาร์ดแวร์แบบเดิมๆ แต่ข้อมูลมากมายมหาศาลเหล่านี้สามารถนำมาใช้ประโยชน์ได้ในทางธุรกิจที่ในอดีตไม่สามารถใช้ได้เพื่อใช้คาดการณ์ ตัดสินใจ และวางแผนนโยบาย  ในปัจจุบันภาคเอกชนมีการปรับตัวเรื่องระบบข้อมูลเพื่อใช้ในการตัดสินมาระยะหนึ่งแล้ว เจ้าไหนปรับตัวไม่ได้อาจไปไม่รอดในตลาดแข่งขันอันดุเดือดนี้

ในภาครัฐเองมีการขยับตัวพัฒนาระบบ Big Data ขึ้นมาเช่นกัน อาจจะเห็นได้จากนโยบายลดใช้สำเนาบัตรประชาชนใช้ใบประชาชนใบเดียวแทนในการมาติดต่อราชการ เป็นต้น

คำถามที่สำคัญ คือ ระบบงานของภาครัฐ ข้าราชการ จะสามารถปรับเปลี่ยนได้มากน้อยแค่ไหน ผู้เขียนเองพอได้เห็นมาบ้างในจดหมายตอบรับของราชการที่ส่งมาพร้อมกับ QR Code เพื่อให้สแกนไปดาวน์โหลดข้อมูลในระบบCloud  การส่งจดหมายถึงราชการผ่านทางอีเมล

ข้อจำกัดของภาครัฐ คือ ขนาดองค์กร ระบบการทำงาน ขั้นตอน คน ระบบการจัดเก็บ ระบบค้นหา การเข้าถึงข้อมูลเอง ข้อมูลพื้นฐานที่ถูกต้อง ความน่าเชื่อถือ เว็บไซต์ที่ใช้งานได้ง่ายเข้าถึงได้จริง แต่ถึงอย่างไรก็ตามที่ผ่านมาภาครัฐเองเริ่มใช้ประโยชน์จากข้อมูล จึงขอยกตัวอย่างเพื่อให้พอเห็นภาพชัดเจนขึ้น

จงยกกรณีตัวอย่างการใช้ big data ในประเทศไทย
องค์ประกอบในการสร้างระบบการแนะนาสถานที่ท่องเที่ยวอัตโนมัติ, กรอบการวิเคราะห์ข้อมูลขนาดใหญ่ภาครัฐ (Government Big Data Analytics Framework)

[1] การเพิ่มศักยภาพด้านการท่องเที่ยวเมืองรองกระทรวงดิจิทัลฯ ร่วมกับการท่องเที่ยวแห่งประเทศไทยและกระทรวงการเที่ยวและกีฬา เพื่อหาสถานที่ท่องเที่ยวที่เหมาะสมกับนักท่องเที่ยวแต่ละกลุ่ม มีการเก็บข้อมูลนักท่องเที่ยวต่างชาติกว่า 120,000 คน ในระยะเวลา 4 ปี โดยเก็บข้อมูลพื้นฐาน คือ เชิงลักษณะ ประชากร (Demographic) เชิงภูมิศาสตร์ (Geographic) เชิงลักษณะจิตวิทยา (Psychographic) และเชิงพฤติกรรม (Behavioral) โดยใช้เทคนิควิธีการวิเคราะห์ จัดกลุ่ม (Clustering Analysis) มี AI ช่วยในการวิเคราะห์ข้อมูล

องค์ประกอบที่สอง คือ โมเดลคำนวณค้นหาสถานที่ท่องเที่ยว (Recommender System) ใช้การอ้างอิงจาก TripAdvisor

องค์ประกอบที่สาม คือ โมเดลคำนวณหาสถานที่ท่องเที่ยวที่คล้ายคลึงกัน (Similarity Analysis) เพื่อแนะนำสถานที่ท่องเท่ียวท่ียังไม่แพร่หลาย หรือไม่มีข้อมูลการไปเที่ยวมากนักในเมืองรอง ซึ่งในการวิเคราะห์เราจะใช้ข้อมูลจากกระทรวงการท่องเที่ยวและกีฬา ที่มีการสำรวจข้อมูลแหล่งท่องเที่ยวและกิจกรรมกว่า 8,000 รายการ

เพื่อทำให้ระบบ AI มีประสิทธิภาพมากและประสิทธิผลมากขึ้น จึงใช้ข้อมูลจากแหล่งอื่นๆ มาวิเคราะห์ ได้แก่

  • ข้อมูลจากหน่วยงานภาครัฐ เช่น ข้อมูลโรงแรมท่ีจดทะเบียนจากกระทรวงมหาดไทยและข้อมูล สำรวจจากสำนักงานสถิติแห่งชาติ, ข้อมูลการเข้าออกประเทศของนักท่องเท่ียวจากสำนักงาน ตรวจคนเข้าเมือง, ข้อมูลการเข้าพักโรงแรมของนักท่องเท่ียวจากกระทรวงการท่องเท่ียวและกีฬา,รวมถึงข้อมูลอื่นๆ ที่ได้มีการเก็บรวบรวมไว้ในฐานข้อมูลของการท่องเท่ียวแห่งประเทศไทย และกระทรวงการท่องเที่ยวและกีฬา 
  • ข้อมูลจากแหล่งข้อมูลภายนอก เช่น ข้อมูลเที่ยวบินทั่วโลกจาก IATA (International Air Transport Association), ข้อมูลการเข้าพักในAirbnb โดยบริษัท AirDNA, ข้อมูลบนสื่อสังคมออนไลน์ เช่น Instagram และ Wongnai, ข้อมูลการค้นหาเกี่ยวกับประเทศไทยจากGoogle Trends,ข้อมูลการใช้จ่ายของนักท่องเท่ียวจากบริษัทเครดิตการ์ด เช่น MasterCard, Visa 

นโยบายการท่องเที่ยวเมืองรองกลายเป็นนโยบายที่สามารถกระจายนักท่องเที่ยวไปยังเมืองใหม่ๆได้ กลายเป็นนโยบายที่ได้รับการตอบรับอย่างดี

[2] การวิเคราะห์สื่อสังคมออนไลน์และพัฒนาเครื่องมือเพื่อรวบรวมข้อมูลสำรวจความคิดเห็นของภาครัฐ: กรณีศึกษาเน็ตประชารัฐ โดยแพลตฟอร์มนี้มุ่งเน้นการ ใช้ข้อมูลที่มีอยู่ในโลกดิจิทัลอยู่แล้ว นั่นคือ 1) ข้อมูลความพึงพอใจหรือความคิดเห็นในรูปแบบของภาษาเขียนจากสื่อสังคมออนไลน์ 2) ข้อมูลการใช้งานเน็ตประชารัฐจากเครื่องแม่ข่ายผู้ให้บริการเน็ตประชารัฐ 3) การสำรวจข้อมูลผ่านการตอบแบบสอบถามออนไลน์  โดยนำข้อมูลจากแพลตฟอร์มนี้เทียบกับข้อมูลจากวิธีเดิมเพื่อหาความเหมือนหรือความต่างกันในลักษณะแนวโน้มของข้อมูล (Correlation) ของ ความเร็ว ความเสถียร วัตถุประสงค์การใช้งาน ความ เหมาะสมของจุดติดตั้ง Wi-Fi ฟรี โดยข้อมูลที่เก็บนั้นจะเป็นข้อมูล2 ปีย้อนหลัง

[3] เครื่องมือประเมินช่วยคัดกรองผู้กระทำผิดที่มีโอกาสย้อนกลับไปกระทำผิดซ้ำเป็นศึกษาข้อมูลจากฐานข้อมูลหลักของ3 หน่วยงาน คือ กรมราชทัณฑ์ กรมควมคุมความประพฤติและกรมพินิจและคุ้มครองเด็กและเยาวชน โดยทำ Exploratory Data Analysis และสร้างเป็น Dashboardเพื่อดูการกระจายตัวของข้อมูลผู้กระทาผิดซ้ำ จากนั้นกระทรวงยุติธรรมได้ทำการรวบรวมข้อมูล จากเครื่องมือที่ใช้ในการปฏิบัติงานเพิ่มเติมเสริมกับข้อมูลจากฐานข้อมูลหลัก 

  • แบบสอบถามเพื่อรวบรวมข้อเท็จจริง จัดทำประวัติ เพื่อจำแนกระดับความเสี่ยงต่อการกระทำผิดซ้ำ โดยแบบสอบถามนี้ถูกใช้เก็บข้อมูลในขั้นตอนการสืบเสาะ/พินิจ การจำแนก/วิเคราะห์เพื่อพัฒนาพฤตินิสัย และการกลับเข้าสู่สังคม
  • แบบสำรวจสภาวะจิตใจ ร่างกาย และพฤติกรรม ซึ่งถูกใช้ในขึ้นตอนการสืบเสาะ/พินิจ 
  • แบบสัมภาษณ์เพื่อติดตามการพัฒนาสภาวะ ซึ่งถูกใช้เก็บข้อมูลด้านการพัฒนาสภาวะในขั้นตอน การจำแนก/วิเคราะห์เพื่อพัฒนาพฤตินิสัยเป็นระยะหลังการพิจารณาคดี
  • แบบสอบถามข้อมูลของผู้กระทำความผิด เช่น ประวัติการกระทำผิด ประวัติการใช้สารเสพติด และการบำบัดรักษา ภูมิหลังทางครอบครัว ประวัติการศึกษาและอาชีพ ประวัติการใช้ความ รุนแรง สภาวะทางจิตและพฤติกรรม ชุมชนและสภาพแวดล้อม การคบเพื่อน ฯลฯ โดยข้อมูลใน ส่วนนี้สามารถใช้งานร่วมกันระหว่างหน่วยงานที่เกี่ยวข้องได้เพื่อระบุกรณีที่ผู้กระทาผิดย้อนกลับ เข้ามาในระบบหลังการปล่อยตัว

[4] โครงการวิเคราะห์ข้อมูลค่าเบิกจ่ายสิทธิการรักษาพยาบาลจากรัฐบาลใช้ในการประเมินงบประมาณกองทุนและการเบิกจ่ายตามพื้นที่ ใช้เพื่อทำนายหรือพยากรณ์โรคที่อาจจะเกิดขึ้นของผู้ป่วยเดิม ใช้เพื่อการจัดสรรทรัพยากรบุคคล สถานที่ และรถพยาบาลได้อย่างเหมาะสมมีประสิทธิภาพ  โดยการเก็บข้อมูลจาก 1) สิทธิสวัสดิการการรักษาพยาบาลของข้าราชการ 2) สิทธิประกันสังคม และ 3) สิทธิหลักประกันสุขภาพ 30 บาท

[5] การศึกษาปัจจัยเพื่อทานายระดับความสามารถของบิดามารดาในการดูแลบุตรวัย 0-3 ขวบ  โดยนำข้อมูลของเด็กจากกระทรวงสาธารณสุข เช่น การได้รับวิตามิน การได้รับการตรวจไทรอยด์ การเข้ารับการตรวจครรภ์ ความถี่ในการพบแพทย์ ระดับพัฒนาการ ฯลฯ เป็นต้น มาทาการวิเคราะห์ด้วย เทคนิค Cluster Analysis เพื่อจัดกลุ่มเด็กตามคุณภาพการเลี้ยงดู โดยจัดกลุ่มได้เป็น 3 กลุ่ม คือ กลุ่มที่ได้รับ การเลี้ยงดูในระดับดี กลุ่มที่ได้รับการเลี้ยงดูระดับปานกลาง และกลุ่มที่ได้รับการเลี้ยงดูระดับที่ควรได้รับ คาแนะนา จากนั้นนาข้อมูลของเด็กจับคู่กับข้อมูลของบิดามารดา โดยใช้ข้อมูลที่ได้จากการบูรณาการของ 5 กระทรวง เช่น ข้อมูลสุขภาพพ่อและแม่ ข้อมูลด้านสถานะทางเศรษฐกิจ การรับเงินกู้ ระดับการศึกษา เป็นต้น เพื่อทาการวิเคราะห์หาสาเหตุรากเหง้า (Root Cause Analysis)

[6] การเพิ่มศักยภาพด้านการจัดเก็บภาษี  วิเคราะห์ข้อมูลโดยใช้เทคโนโลยีด้านการเรียนรู้ของเครื่อง (Machine learning) เพื่อสร้าง แบบจำลองในการพยากรณ์รายรับของธุรกิจ

[7] การวิเคราะห์รูปแบบภูมิอากาศเพื่อการวางแผนของท่าอากาศยาน กรณีศึกษาการบูรณาการ ข้อมูลที่เกี่ยวข้องกับสภาพอากาศที่มีอยู่ ได้แก่ 1) ข้อมูลอุณหภูมิ/ความชื้นสัมพัทธ์/ทิศทางลม/ความกดอากาศ 2) ข้อมูลสภาพทัศนวิสัย 3) ข้อมูลปริมาณเมฆ 4) ข้อมูลลักษณะอากาศปัจจุบัน 5) มาทำการวิเคราะห์ด้วย เทคนิค Cluster Analysis อุตุนิยมวิทยา  ามารถใช้ในการวางแผนด้าน การบริหารความเสี่ยงเรื่องการบิน และใช้ในการจัดทาแผนส่งเสริมการท่องเที่ยวให้เหมาะสมกับสภาพอากาศที่เปลี่ยนไปได้

[8] การจัดทำแพลตฟอร์มการรวบรวมข้อมูลเพื่อการวิเคราะห์“Digital Transformation ตามมาตรฐาน” OECD (Digital Economy Outlook) ใน 6 มิติหลัก คือ การเข้าถึง การใช้นวัตกรรม การทางาน สังคม ความเชื่อมั่น และการเปิดตลาด โดยผลการวิเคราะห์ สามารถนามาใช้เป็นข้อมูลสนับสนุนการวางแผนการพัฒนาดิจิทัลเพื่อเศรษฐกิจและสังคมในระดับมหภาค

จงยกกรณีตัวอย่างการใช้ big data ในประเทศไทย
ที่มา สำนักงานพัฒนารัฐบาลดิจิทัล(องค์การมหาชน) (สพร.)

[10] One Map คือ การปรับปรุงแผนที่แนวเขตที่ดินของรัฐแบบบูรณาการ มาตราส่วน 1:4,000 เพื่อให้แนวเขตไม่ทับซ้อนกัน ลดปัญหาเรื่องที่ดิน

จงยกกรณีตัวอย่างการใช้ big data ในประเทศไทย
ที่มา กรมประชาสัมพันธ์by ศูนย์เทคโนโลยีฯ.

อีกทั้งยังมีการใช้ Big Data ในด้านภัยพิบัติทางธรรมชาติ การจัดการน้ำ การท่องเที่ยว การเกษตร และสาธารณสุข

เมื่อภาครัฐมีการเปลี่ยนแปลงระบบข้อมูลในช่วง 4-5 ปี มานี้ จะประสบความสำเร็จระดับไหน เราประชาชนจะได้รับประโยชน์อะไรบ้าง คงต้องติดตามกันต่อไป ในระหว่างนี้อาจเข้าไปใช้ข้อมูลที่ภาครัฐได้เผยแพร่มาใช้ประโยชน์ได้ก่อนไม่มากก็น้อย.

ขอบคุณครับ

อ้างอิง
     คณะอนุกรรมการออกแบบสถาปัตยกรรม (Architecture Design) ระบบบูรณาการข้อมูลภาครัฐ ภายใต้คณะกรรมการขับเคลื่อนการดําเนินนโยบายเพื่อใช้ประโยชนข้อมูลขนาดใหญ่ (Big Data) ศูนย์ข้อมูล(Data Center) และคลาวด์คอมพิวติ้ง (Cloud Computing).  (2561), (ร่าง)กรอบการวิเคราะห์ข้อมูลขนาดใหญ่ภาครัฐ (Government Big Data Analytics Framework
     ดร.ศักดิ์ เสกขุนทด. ผู้อํานวยการสํานักงานรัฐบาลอิเล็กทรอนิกส์. (2560). แนวทางการบริหารจัดการ Big Data และ Digital Transformation ในภาครัฐ. ค้นเมื่อ 23 ธันวาคม 2562, http://www.sepo.go.th/assets/document/file/Big%20Data%20และ%20Digital%20Transformation.pdf
     สำนักงานพัฒนารัฐบาลดิจิทัล (องค์การมหาชน) (สพร.) Digital Government Development Agency (Public Organization) (DGA). ค้นเมื่อ 23 ธันวาคม 2562, https://www.dga.or.th/th/content/920/12311/
     กรมประชาสัมพันธ์ by ศูนย์เทคโนโลยีฯ. (2016). ค้นเมื่อ 23 ธันวาคม 2562, https://www.facebook.com/ICTPRD/photos/a.950628478387274/950628598387262/?type=3&theater
     ณัฏฐา กาญจนขุนดี . (2018). Big Data ข้อมูลขนาดใหญ่คืออะไร ทำงานอย่างไร และนำไปใช้อะไรได้บ้าง. ค้นเมื่อ 23 ธันวาคม 2562, https://www.khundee.com/big-data-คืออะไร-ทำงานอย่างไร/
     กรมอุตุนิยม กับ Big Data. (2562). ค้นเมื่อ 23 ธันวาคม 2562, http://www.rnd.tmd.go.th/doc/bigdata/Presentations/BigData&TMD_V1.pdf
     Shivam Arora. (2019). Top Big Data Certifications for 2020. ค้นเมื่อ 23 ธันวาคม 2562, https://www.simplilearn.com/top-big-data-certifications-article