กลุ่มผลิตภัณฑ์ของ Power BI แบ่งหลัก ๆ ออกเป็น Power BI Desktop แอปพลิเคชันสำหรับเครื่องเดสก์ท็อป Windows, Power BI Service ให้บริการ SaaS (Software as a Service) แบบออนไลน์ที่, Power BI Mobile แอปพลิเคชันสำหรับอุปกรณ์เคลื่อนที่ และ Power BI Report Server Show (Source: https://www.scnsoft.com/blog/what-is-power-bi) องค์ประกอบของโปรแกรมสำหรับในส่วนของโปรแกรม Power BI Desktop มีการแบ่งส่วนการทำงานออกเป็น 2 ส่วนด้วยกันคือ (1) Power BI Desktop เป็นส่วนที่ใช้ในการสร้าง Visualization และ (2) Power Query เป็นส่วนที่ใช้สำหรับการบริหารจัดการเกี่ยวกับข้อมูล เช่น กระบวนการทำความสะอาดข้อมูล (Data cleansing หรือ Data scrubbing) หรือกระบวนการแปลงข้อมูล (Data Transformation) ในบทความนี้เราจะมาลองสำรวจรูปแบบการบริหารจัดการข้อมูลรูปแบบต่าง ๆ ที่พบกันได้บ่อยในการทำงานกับข้อมูล พร้อมทั้งคำสั่งที่เกี่ยวข้องไปด้วยกัน การเตรียมข้อมูลเบื้องต้นด้วย Power BI1. การลบแถวข้อมูล (คำสั่ง Remove Rows)ที่ Ribbon Home > Remove Rows > Remove Top Rows > Number of rows: 2 (ระบุจำนวนแถวข้อมูลที่ต้องการลบ) 2. การตั้งแถวแรกให้เป็นชื่อคอลัมน์ในการนำเข้าข้อมูลที่เป็นไฟล์ Excel แล้วพบว่าแถวข้อมูลที่ควรจะเป็นหัวตารางหรือชื่อคอลัมน์ กลับกลายเป็นส่วนหนึ่งของชุดข้อมูล กรณีเช่นนี้สามารถแก้ไขได้โดยใช้คำสั่ง Use First Row as Headers : ที่ Ribbon Home > User First Row as Headers 3. การลบคอลัมน์ (คำสั่ง Remove Columns)คลิกเลือกคอลัมน์ที่ต้องการลบ แล้วไปที่ Ribbon Home > Remove Columns 4. การปรับเปลี่ยนชนิดหรือรูปแบบของข้อมูล (คำสั่ง Data Type Setting)* ส่วนนี้จะทำงานที่ Power BI Desktop
5. การแยกคอลัมน์ (คำสั่ง Split Column)ในการจัดเก็บข้อมูลอาจจะพบลักษณะการจัดเก็บหลาย ๆ ข้อมูลในคอลัมน์เดียวกัน ตัวอย่างเช่น (ดูรูปประกอบ) มีการเก็บข้อมูลชื่อหนัง (ปีที่เริ่มฉาย) อยู่ภายในคอลัมน์เดียวกัน หากเราต้องการแยกข้อมูลสองเรื่องนี้ออกจากกัน สามารถใช้คำสั่งในการแยกคอลัมน์ได้ แต่จะต้องมีเงื่อนไขที่สามารถแยกคอลัมน์นั้น ๆ เช่น มีสัญลักษณ์พิเศษ หรือแยกตามตำแหน่งที่ระบุ
6. การรวบคอลัมน์ด้วยคำสั่ง Unpivotในการเก็บข้อมูล โดยเฉพาะอย่างยิ่งรูปแบบของไฟล์ Excel ที่นอกจากจะเป็นการเก็บข้อมูลแล้ว ยังเป็นการแสดงข้อมูลในรูปแบบของรายงานด้วย ตัวอย่างเช่น (ดูรูปประกอบ) แสดงข้อมูลยอดขายรายเดือนในรายคอลัมน์ และแสดงข้อมูลรายปีในรายแถวข้อมูล หากต้องการนำข้อมูลลักษณะดังกล่าวมาสร้างเป็นกราฟ เพื่อให้สามารถเปรียบเทียบยอดขายรายเดือนได้ จะต้องทำการรวมคอลัมน์เดือนดังกล่าวให้เป็นคอลัมน์เดียวกัน ลักษณะนี้สามารถทำได้ด้วยการใช้คำสั่ง Unpivot Columns
7. การรวมข้อมูลในลักษณะของการรวมแถวข้อมูล (คำสั่ง Append Queries)หลาย ๆ ครั้งในการเก็บข้อมูลในรูปแบบของไฟล์ Excel จะมีการเก็บข้อมูลที่มีรูปแบบเดียวกัน แต่แยกเป็นหลาย ๆ Sheet เพื่อความสะดวกในการทำรายงานสรุป แต่เมื่อต้องการนำข้อมูลทั้งหมดมารวมกันเพื่อวิเคราะห์เปรียบเทียบ จะต้องทำการรวมข้อมูลจากหลาย ๆ Sheet หรือแม้กระทั่งหลาย ๆ ไฟล์ ลักษณะนี้สามารถทำได้ด้วยการใช้คำสั่ง Append Queries แต่มีข้อสังเกตคือการจะรวมแถวข้อมูลได้นั้น ข้อมูลในแต่ละ Sheet หรือแต่ละไฟล์ จะต้องมีรูปแบบโครงสร้างแบบเดียวกัน เช่น มีจำนวนคอลัมน์, ชื่อคอลัมน์, ลำดับของคอลัมน์ ที่เหมือนกัน
8. การรวมข้อมูลในลักษณะของการอ้างอิงคอลัมน์ (คำสั่ง Merge Queries)จะเป็นการรวมข้อมูลจาก 2 ตาราง/Sheet/ไฟล์ โดยมีคอลัมน์อ้างอิงข้อมูลซึ่งกันและกัน เช่น ข้อมูลรายละเอียดการขายสินค้า กับข้อมูลสินค้า จะมีคอลัมน์อ้างอิงกันคือคอลัมน์รหัสสินค้า การรวมข้อมูลลักษณะนี้สามารถทำได้ด้วยการใช้คำสั่ง Merge Queries
จากที่ได้กล่าวมา เป็นเพียงตัวอย่างการใช้งาน Power BI ในการเตรียมข้อมูลเบื้องต้นเท่านั้น ทั้งนี้ตัวโปรแกรมเองยังมีความสามารถในการเตรียมข้อมูลในลักษณะอื่นๆ อีก ซึ่งความสามารถในส่วนนี้มีความสำคัญและช่วยให้การสร้าง Visualization สะดวกมากขึ้น ขั้นตอนใดคือขั้นตอนการเตรียมข้อมูลการเตรียมข้อมูลเป็นกระบวนการจัดเตรียมข้อมูลดิบเพื่อให้เหมาะกับการประมวลผลและการวิเคราะห์เพิ่มเติม ขั้นตอนที่สำคัญ ได้แก่ การเก็บรวบรวม การทำความสะอาด และการระบุประเภทข้อมูลสำหรับข้อมูลดิบในรูปแบบที่เหมาะสมสำหรับอัลกอริทึมของแมชชีนเลิร์นนิ่ง (ML) แล้วจึงสำรวจและแสดงผลข้อมูลต่อไป การเตรียมข้อมูลอาจใช้เวลาถึง 80% ของเวลา ...
การเตรียมข้อมูลแบ่งออกเป็น 3 ขั้นตอน อะไรบ้างการตรียมข้อมูลโดยทั่วไปแบ่งการทางานออกได้เป็น 3 ขั้นตอน ได้แก่การทาความสะอาดข้อมูล (Data Cleaning) การเลือกข้อมูล (Data Selection) และการแปลงข้อมูล (Data transformation) 2.1 การทาความสะอาดข้อมูล (Data Cleaning)
การเตรียมข้อมูลแบ่งออกเป็นกี่ขั้น อะไรบ้างขั้นตอนการเตรียมข้อมูล 1. การตรวจสอบแก้ไขข้อมูลเบื้องต้น 2. การให้รหัสข้อมูล 3. การบันทึกข้อมูล 4. การตรวจสอบแก้ไขรหัสข้อมูลครั้งสุดท้าย 2 การตรวจสอบแก้ไขข้อมูลเบื้องต้น
การทําความสะอาดข้อมูล (Data Cleaning)อยู่ในขั้นตอนใดการทำความสะอาดข้อมูล Data cleansing หรือ data cleaning หรือ data scrubbing คือ กระบวนการตรวจสอบ การแก้ไข หรือการลบ เพื่อให้รายการข้อมูลที่ไม่ถูกต้องออกไปจากชุดข้อมูล ตารางหรือฐานข้อมูล ซึ่งเป็นหลักสำคัญของฐานข้อมูล เพราะหมายถึงความไม่สมบูรณ์ ความไม่ถูกต้อง ความไม่สัมพันธ์กับข้อมูลอื่น ๆ เป็นต้น จึงทำให้ผู้เชี่ยวชาญหลาย ...
|