ข้อใด ควร เก็บ ข้อมูล โดย ใช้ข้อมูลอนุกรมเวลา

2. �����ѹ���� (timeliness) �繢����ŷ��ѹ���� (up to date) ��зѹ��ͤ�����ͧ��âͧ ����� ��Ҽ�Ե�������͡�Ҫ�� ������դس��Ҷ֧�����繢����ŷ��١��ͧ����ӡ���

3. ��������ó�ú��ǹ (completeness) �����ŷ�����Ǻ����ҵ�ͧ�繢����ŷ��������稨�ԧ (facts) ���͢������ (information) ���ú��ǹ�ء��ҹ�ء��С�� ����Ҵ��ǹ˹����ǹ�价���������������

4. ������зѴ�Ѵ (conciseness) �����ŷ�����Ѻ��ǹ�˭�С�ШѴ��Ш�� ��èѴ�������������� �ٻẺ����зѴ�Ѵ����������� �дǡ��͡������Ф��� ������դ���������ѹ��

5. �����ç�Ѻ������ͧ��âͧ����� (relevance) �����ŷ��Ѵ�Ӣ���Ҥ���繢����ŷ������ �����ŵ�ͧ����� ��Ш��繵�ͧ��� / ��Һ �����繻���ª���͡�èѴ��Ἱ ��˹���º�����͵Ѵ�Թ�ѭ�������ͧ���� ������繢����ŷ��Ѵ�Ӣ�������ҧ�ҡ��� ��������õ�ͧ������������ç�Ѻ������ͧ��âͧ����������

6. ����������ͧ (continuity) ������Ǻ��������� ������ҧ��觷��е�ͧ���Թ������ҧ����������е�����ͧ��ѡɳТͧ͹ء������ (time-series) ���ͨ����������ª��㹴�ҹ������������Ԩ��������������͹Ҥ�

ถ้าพูดถึงบทเรียนคณิตศาสตร์เรื่องสถิติและข้อมูล ม.6 เพื่อน ๆ อาจจะนึกถึงกราฟ แผนภูมิ และตัวเลขชวนปวดหัว (แค่ฟังก็อยากจะขนที่นอนหมอนมุ้งมาเตรียมหลับเลยทีเดียว) แต่จริง ๆ แล้วสถิติไม่ได้เป็นเรื่องไกลตัวเราขนาดนั้นเลย อย่างการถามเพื่อนในกลุ่มว่าวันนี้จะไปกินข้าวร้านไหนดี การพยากรณ์อากาศ ไปจนถึงการทำนายจำนวนผลผลิตทางการเกษตร ก็นับเป็นเรื่องที่เกี่ยวข้องกับสถิติ แต่จะเกี่ยวกันยังไงนั้น เราไปดูกันเลยดีกว่า

เพื่อน ๆ สามารถเรียนเรื่องสถิติและข้อมูลกันได้ในรูปแบบแอนิเมชันที่แอปพลิเคชัน StartDee ได้เลย หรือจะลองทำโจทย์ก็ได้นะ คลิกที่บทความนี้เลย

ข้อใด ควร เก็บ ข้อมูล โดย ใช้ข้อมูลอนุกรมเวลา

 

สถิติ คืออะไร

คำว่า สถิติ (Statistics) มีความหมาย 2 แบบด้วยกัน ความหมายแรก คือ ‘สถิติศาสตร์’ ซึ่งเป็นวิชาที่ว่าด้วยการจัดเก็บ รวบรวม วิเคราะห์ สรุปผล และนำเสนอข้อมูล เพื่อนำข้อมูลไปใช้สำหรับการตัดสินใจ หรือการคาดคะเนข้อมูลบางอย่าง และเป็นความหมายที่เราจะมาพูดถึงกันในบทความนี้ ส่วนสถิติ ในอีกความหมายหนึ่ง คือ ตัวเลขที่ได้จากการเก็บรวบรวมข้อมูล ใช้บ่งบอกข้อเท็จจริงบางอย่างที่เราสนใจ แต่ก็มีบางครั้งที่ผู้พูดอาจจะนำข้อมูลสถิติไปใช้เป็นกลยุทธ์ลวงตาเรา จนทำให้ผู้ที่ไม่เข้าใจเรื่องสถิติ ตกเป็นเหยื่อของโฆษณาชวนเชื่อได้ เช่น “80% ของผู้ใช้ผลิตภัณฑ์นี้บอกว่าผิวกระจ่างใสขึ้นทันตาเห็น !” แต่คำว่า 80% ในที่นี้อาจจะมาจากผู้ทดลองใช้ผลิตภัณฑ์แค่ 5-10 คน ซึ่งไม่สามารถเป็นตัวแทนของผู้ใช้จริงทั้งหมด

ดังนั้น สถิติเลยไม่ใช่เรื่องของตัวเลขบนกราฟหรือแผนภูมิเพียงอย่างเดียว แต่เป็นเรื่องที่ช่วยให้เรารู้เท่าทันตัวเลขและข้อมูลต่าง ๆ ในชีวิตจริงว่าน่าเชื่อถือมากน้อยแค่ไหน และนำไปใช้วิเคราะห์อะไรได้บ้าง โดยเฉพาะในยุคที่โลกโซเชียลมีข่าวสารเยอะแยะไปหมดในปัจจุบัน

 

ประชากรและตัวอย่าง

ประชากร (population) คือ กลุ่มของหน่วยทั้งหมดในเรื่องที่สนใจศึกษา หน่วยในที่นี้อาจเป็นคน สัตว์ หรือสิ่งของก็ได้ เช่น ถ้าสนใจศึกษานักเรียนชั้นมัธยมศึกษาปีที่ 6 ประชากรก็จะหมายถึงนักเรียนทุกคนที่กำลังเรียนอยู่ชั้นมัธยมศึกษาปีที่ 6 แต่ถ้าประชากรมีจำนวนมาก อย่างการสอบถามความคิดเห็นของคนไทยทั้งประเทศ คงเป็นเรื่องที่เก็บข้อมูลได้ยากและใช้เวลานาน ดังนั้น เราเลยต้องสุ่มเลือกประชากรบางส่วน (เหมือนเป็นตัวแทนหมู่บ้าน) ออกมาเพื่อสอบถามแล้วสรุปผลความคิดเห็นของประชากรทั้งหมด ซึ่งตัวแทนของประชากรที่เราสุ่มออกมานั้นเรียกว่า กลุ่มตัวอย่าง (sample)

ข้อใด ควร เก็บ ข้อมูล โดย ใช้ข้อมูลอนุกรมเวลา
ภาพแสดงประชากร (ซ้าย) และกลุ่มตัวอย่าง (ขวา)  (ขอบคุณภาพจาก OMNICONVERT)

แต่ข้อควรระวังของการสุ่มตัวอย่าง คือ หากเกิดความลำเอียงอาจทำให้สรุปผลผิดพลาดได้ เช่น การสอบถามความคิดเห็นของวัยรุ่น มากกว่าช่วงวัยอื่น ๆ อาจจะทำให้ผลออกมา ไม่ตรงกับคำตอบของคนทั้งประเทศได้ ดังนั้น การสุ่มตัวอย่างที่ดี ควรกระจายให้ทั่วทุกกลุ่มประชากร อาจใช้วิธีแบ่งกลุ่มตัวอย่างออกเป็นหลาย ๆ ช่วงอายุ แล้วค่อยสุ่มมาจากแต่ละกลุ่มอายุตามอัตราส่วน และหลังจากสุ่มตัวอย่างแล้ว ลักษณะต่าง ๆ ที่เราสนใจศึกษาจากประชากรหรือกลุ่มตัวอย่างเหล่านี้ว่า ตัวแปร (variable) และเรียกค่าที่ได้ของตัวแปรนี้ว่า ข้อมูล 

 

ตัวอย่าง สำรวจคณะที่นักเรียนชั้นมัธยมศึกษาปีที่ 6 ต้องการศึกษาต่อ โดยการสุ่มถามนักเรียนจำนวน 40 คน พบว่ามีผู้สนใจศึกษาต่อคณะสถาปัตยกรรมศาสตร์ จำนวน 10 คน คณะแพทยศาสตร์ จำนวน 10 คน คณะนิติศาสตร์จำนวน 5 คน คณะอื่น ๆ อีกจำนวน 15 คน 

  • ประชากร คือ นักเรียนชั้นมัธยมศึกษาปีที่ 6 ทั้งหมด

  • กลุ่มตัวอย่าง คือ นักเรียนชั้นมัธยมศึกษาปีที่ 6 จำนวน 40 คนที่ถูกสุ่มถาม

  • ตัวแปร คือ คณะที่นักเรียนสนใจศึกษาต่อ 

  • ข้อมูล คือ คณะที่นักเรียนตอบว่าสนใจศึกษาต่อ เช่น คณะแพทยศาสตร์ คณะสถาปัตยกรรมศาสตร์

 

ประเภทของข้อมูล

1.การแบ่งประเภทตามแหล่งที่มา

  • ข้อมูลปฐมภูมิ คือ ข้อมูลที่เรารวบรวมมาเอง หรือนำมาจากต้นกำเนิดของข้อมูลโดยตรง มีความน่าเชื่อถือสูง แต่อาจมีค่าใช้จ่ายในการเก็บรวบรวมข้อมูลเอง เช่น พี่สาวคนโตตกลงกับน้อง ๆ ว่าวันหยุดยาวนี้ไปเที่ยวที่ไหนดี ข้อมูลนี้จะเป็นข้อมูลปฐมภูมิสำหรับพี่สาว
  • ข้อมูลทุติยภูมิ คือ ข้อมูลที่รวบรวมมาจากแหล่งอื่นอีกที เช่น พี่สาวคนโต รวบรวมความคิดเห็นของน้อง ๆ มาบอกคุณพ่อคุณแม่ว่าแต่ละคนอยากไปเที่ยวที่ไหนกันบ้าง ข้อมูลนี้จะกลายเป็นข้อมูลทุติยภูมิสำหรับคุณพ่อคุณแม่

2.การแบ่งประเภทตามระยะเวลาที่เก็บข้อมูล

  • ข้อมูลอนุกรมเวลา คือ ข้อมูลที่เก็บค่าต่อเนื่องในแต่ละเวลา เช่น รายจ่ายของแต่ละวันในหนึ่งเดือน
  • ข้อมูลแบบตัดขวาง คือ ข้อมูลที่เจาะจงเวลาลงไปว่าสนใจค่าของเวลาไหน เช่น ข้อมูลปริมาณน้ำฝนของวันนี้ในแต่ละจังหวัด

3.การแบ่งประเภทตามลักษณะของข้อมูล

  • ข้อมูลเชิงปริมาณ คือ ข้อมูลที่เก็บเป็นค่าตัวเลข นำไปบวกลบคูณหารกันได้ เช่น ส่วนสูง อายุ คะแนนสอบ แต่ไม่ใช่ตัวเลขทั้งหมดจะเป็นข้อมูลเชิงปริมาณ อย่างการวัดระดับความพึงพอใจ แม้จะมีเรต 1-5 แต่ตัวเลขเหล่านี้ เป็นตัวแทนของความพอใจน้อยไปหามาก ไม่ได้หมายถึงตัวเลขที่นำมาคำนวณได้จริง ๆ ดังนั้น ข้อมูลระดับความพึงพอใจที่ว่านี้จึงเป็นข้อมูลเชิงคุณภาพ
  • ข้อมูลเชิงคุณภาพ คือ ข้อมูลที่บ่งบอกลักษณะ ไม่สามารถระบุเป็นตัวเลขได้ เช่น เพศ อาชีพ อาหารที่ชอบ และระดับความพึงพอใจอย่างที่ได้กล่าวไปข้างต้น

 

สถิติเชิงพรรณาและสถิติเชิงอนุมาน

การนำสถิติไปใช้งานนั้น สามารถแบ่งได้เป็น 2 ประเภท คือ

  • สถิติเชิงพรรณา 

คำว่าพรรณนา แปลว่าบรรยายหรืออธิบาย ดังนั้นสถิติเชิงพรรณนาจึงหมายถึง การบรรยายหรือวิเคราะห์ข้อมูล โดยอาจเป็นข้อมูลเชิงปริมาณหรือคุณภาพก็ได้ โดยมักจะใช้เพื่อสรุปผลข้อมูลที่มีอยู่จำนวนมาก เช่น การหาอายุเฉลี่ยของลูกค้าประจำร้าน A เป็นต้น

  • สถิติเชิงอนุมาน 

คำว่า อนุมาน หมายถึง ทำนายหรือคาดการณ์ ดังนั้น สถิติเชิงอนุมานจึงหมายถึง การใช้ข้อมูลจากกลุ่มตัวอย่างเพื่อทำนายลักษณะของข้อมูลประชากรทั้งหมด อย่างการสอบถามกิจกรรมยามว่างของนักเรียนทั้งโรงเรียน การที่เราเลือกกลุ่มตัวอย่างจากนักเรียนบางห้อง มาสอบถามแล้วสรุปผล โดยคาดว่าน่าจะเป็นกิจกรรมที่นักเรียนส่วนใหญ่ชอบทำในเวลาว่าง เรียกว่าเป็นการใช้สถิติเชิงอนุมานนั่นเอง

 

ตัวอย่างการใช้งานสถิติ

ข้อใด ควร เก็บ ข้อมูล โดย ใช้ข้อมูลอนุกรมเวลา

(ขอบคุณภาพจาก Techsauce)

จากกราฟข้างต้นเป็นสถิติอัตราการเสียชีวิตของผู้ติดเชื้อโควิด-19 ในประเทศจีน โดยแบ่งตามช่วงอายุ ซึ่งหากเรานำสิ่งที่เรียนรู้ไปข้างต้นมาอธิบายกราฟนี้ จะได้ว่า

ข้อมูลทั้งหมดไม่ได้สำรวจจากกลุ่มตัวอย่าง แต่สำรวจจากประชากร คือผู้ติดเชื้อที่เสียชีวิตทั้งหมด 44,415 คน ส่วนประเภทของข้อมูลเป็นแบบตัดขวาง เพราะศึกษาเจาะจงช่วงเวลา ไม่ได้ศึกษาอย่างต่อเนื่อง คือ เฉพาะช่วงเริ่มต้นการระบาดจนถึงวันที่ 12 กุมภาพันธ์ 2020 โดยเป็นสถิติแบบพรรณนา เพราะเป็นการสรุปผลจากข้อมูลทั้งหมด มีตัวแปร คือ อัตราการเสียชีวิตในแต่ละช่วงอายุ และเป็นข้อมูลทุติยภูมิเพราะเราไม่ได้เป็นคนสำรวจเอง

ทั้งหมดนี้ก็เป็นเนื้อหาในบทเรียนและตัวอย่างที่เพื่อน ๆ สามารถนำไปปรับใช้กับการดูข้อมูลสถิติจากแหล่งอื่น ๆ ได้ ไม่ว่าจะเป็นการอ่านหนังสือ ดูข่าวหรือเจอบนหน้าฟีดเฟซบุ๊ก ซึ่งถ้าอยากจะทบทวนให้เข้าใจมากขึ้น ก็สามารถโหลดแอปพลิเคชัน StartDee มาเรียนเรื่องสถิติและข้อมูล ม.6 กันต่อ หรือถ้าอยากจะอ่านวิชาอื่นเพิ่มเติม ไม่ว่าจะเป็นอังกฤษ ภาษาไทย ฟิสิกส์ และอีกหลาย ๆ วิชา ก็คลิกอ่านใน Blog StartDee ของเรากันได้เลย ส่วนใครที่เรียนจบแล้ว ไปทำโจทย์คณิตศาสตร์เรื่องสถิติและข้อมูลกัน

ข้อใด ควร เก็บ ข้อมูล โดย ใช้ข้อมูลอนุกรมเวลา

Did you know ?

นอกจากสถิติจะเป็นบทเรียนแล้ว ยังมีอาชีพ ‘นักสถิติ’ ด้วยนะ ซึ่งอาชีพนี้มีบทบาทสำคัญในการวิเคราะห์ สรุปผล และทำนายข้อมูลต่าง ๆ และในระดับมหาวิทยาลัย ยังมีสาขาวิชาสถิติโดยเฉพาะซึ่งมักจะอยู่ในคณะพาณิชยศาสตร์และการบัญชี และคณะวิทยาศาสตร์