เมื่อกล่าวถึงค่ากลางของข้อมูล หลายคนคงนึกถึงค่าเฉลี่ย ในภาษาไทยเราแปล mean และ average ว่าค่าเฉลี่ยทั้งคู่ ...แล้วคำไหนเป็นค่ากลางของข้อมูลที่เราต้องการกล่าวถึงกันแน่?
ในทางสถิติ เราใช้ average ในการกล่าวถึงค่ากลางของข้อมูลแบบรวมๆ คำว่ากลางในที่นี้แปลความหมายได้หลายแบบ อาจเป็นตำแหน่งตรงกลาง หรือเป็นตำแหน่งที่ทำให้ข้อมูลสมดุล หรือกลางในความหมายของการเกิดขึ้นบ่อย ดังนั้นเมื่อกล่าวถึง average จึงไม่ได้เจาะจงไปที่ค่าแบบใดแบบหนึ่งโดยเฉพาะ แต่เรามักจะตีความกันไปเองว่าเป็นการเอาผลรวมของข้อมูลมาหารด้วยจำนวนข้อมูล
ค่ากลางของข้อมูล (average) ที่เราคุ้นเคยกันทั่วไป ได้แก่ mean, median, และ mode
1. mean หรือ ค่าเฉลี่ย คำนวณจากผลรวมของข้อมูลหารด้วยจำนวนข้อมูล ถ้ากำหนดให้ข้อมูล n ตัวแทนด้วย x1, x2, ..., xn ค่าเฉลี่ยของข้อมูลคำนวณได้จาก (x1 + x2 + ... + xn)/n ค่านี้เป็นเหมือนจุดสมดุลของข้อมูล... แล้วสมดุลหมายถึงอะไร? อยู่ตรงกลางพอดีมั้ย?
จินตนาการว่าข้อมูลของเราเหมือนวัตถุที่อยู่บนแผ่นไม้บางๆ ในกรณีที่ข้อมูลของเรากระจายสม่ำเสมอ จุดที่ดันแผ่นไม้ไว้แล้วทำให้มันสมดุลได้ก็จะอยู่ตรงกลาง แต่ถ้ามีข้อมูลบางตัวแยกออกมาจากกลุ่มก็จะทำให้จุดสมดุลต้องขยับเลื่อนไปเพื่อให้แผ่นไม้รักษาแนวระนาบอยู่ได้ ดังแสดงในภาพ
จากภาพเมื่อมีข้อมูลบางตัวขยับแยกออกไปจากกลุ่ม ก็จะทำให้ค่าเฉลี่ยของเราขยับออกไปในทิศทางเดียวกัน เพื่อพยายามจะรักษาสมดุลของข้อมูลไว้
2. median หรือ มัธยฐาน คือค่าที่อยู่ตำแหน่งตรงกลางของข้อมูลเมื่อมีการจัดเรียงข้อมูลจากน้อยไปมากแล้ว ตำแหน่งของข้อมูลที่เป็นค่ามัธยฐานหาได้จาก (n+1)/2 เมื่อ n เป็นจำนวนข้อมูล เช่น ถ้าเรามีข้อมูลที่เรียงลำดับกันอยู่แล้ว 7 ตัว ตำแหน่งของมัธยฐานจะเป็น (7+1)/2 = 4 หรือเป็นข้อมูลในลำดับที่ 4 นั่นเอง แต่ถ้าเรามีข้อมูล 8 ตัว ตำแหน่งของมัธยฐานจะเป็น 4.5 หรือค่ามัธยฐานของเราจะอยู่ระหว่างข้อมูลตัวที่ 4 และข้อมูลตัวที่ 5 ดังแสดงในภาพ
3. mode หรือ ฐานนิยม เป็นค่าของข้อมูลที่มีการเกิดซ้ำสูงสุดหรือมีความถี่สูงสุด หากข้อมูลแต่ละตัวเกิดขึ้นเพียงครั้งเดียวเท่านั้น จะถือว่าไม่มีฐานนิยมในข้อมูลชุดนั้น แต่ถ้ามีข้อมูลหลายตัวที่มีค่าความถี่เท่ากันและเป็นค่าความถี่ที่สูงสุด จะถือว่ามีค่าฐานนิยมได้หลายตัว ตัวอย่างของฐานนิยมแสดงในภาพ
ในทางสถิติ เราใช้ average ในการกล่าวถึงค่ากลางของข้อมูลแบบรวมๆ คำว่ากลางในที่นี้แปลความหมายได้หลายแบบ อาจเป็นตำแหน่งตรงกลาง หรือเป็นตำแหน่งที่ทำให้ข้อมูลสมดุล หรือกลางในความหมายของการเกิดขึ้นบ่อย ดังนั้นเมื่อกล่าวถึง average จึงไม่ได้เจาะจงไปที่ค่าแบบใดแบบหนึ่งโดยเฉพาะ แต่เรามักจะตีความกันไปเองว่าเป็นการเอาผลรวมของข้อมูลมาหารด้วยจำนวนข้อมูล
ค่ากลางของข้อมูล (average) ที่เราคุ้นเคยกันทั่วไป ได้แก่ mean, median, และ mode
1. mean หรือ ค่าเฉลี่ย คำนวณจากผลรวมของข้อมูลหารด้วยจำนวนข้อมูล ถ้ากำหนดให้ข้อมูล n ตัวแทนด้วย x1, x2, ..., xn ค่าเฉลี่ยของข้อมูลคำนวณได้จาก (x1 + x2 + ... + xn)/n ค่านี้เป็นเหมือนจุดสมดุลของข้อมูล... แล้วสมดุลหมายถึงอะไร? อยู่ตรงกลางพอดีมั้ย?
จินตนาการว่าข้อมูลของเราเหมือนวัตถุที่อยู่บนแผ่นไม้บางๆ ในกรณีที่ข้อมูลของเรากระจายสม่ำเสมอ จุดที่ดันแผ่นไม้ไว้แล้วทำให้มันสมดุลได้ก็จะอยู่ตรงกลาง แต่ถ้ามีข้อมูลบางตัวแยกออกมาจากกลุ่มก็จะทำให้จุดสมดุลต้องขยับเลื่อนไปเพื่อให้แผ่นไม้รักษาแนวระนาบอยู่ได้ ดังแสดงในภาพ
จากภาพเมื่อมีข้อมูลบางตัวขยับแยกออกไปจากกลุ่ม ก็จะทำให้ค่าเฉลี่ยของเราขยับออกไปในทิศทางเดียวกัน เพื่อพยายามจะรักษาสมดุลของข้อมูลไว้
2. median หรือ มัธยฐาน คือค่าที่อยู่ตำแหน่งตรงกลางของข้อมูลเมื่อมีการจัดเรียงข้อมูลจากน้อยไปมากแล้ว ตำแหน่งของข้อมูลที่เป็นค่ามัธยฐานหาได้จาก (n+1)/2 เมื่อ n เป็นจำนวนข้อมูล เช่น ถ้าเรามีข้อมูลที่เรียงลำดับกันอยู่แล้ว 7 ตัว ตำแหน่งของมัธยฐานจะเป็น (7+1)/2 = 4 หรือเป็นข้อมูลในลำดับที่ 4 นั่นเอง แต่ถ้าเรามีข้อมูล 8 ตัว ตำแหน่งของมัธยฐานจะเป็น 4.5 หรือค่ามัธยฐานของเราจะอยู่ระหว่างข้อมูลตัวที่ 4 และข้อมูลตัวที่ 5 ดังแสดงในภาพ
3. mode หรือ ฐานนิยม เป็นค่าของข้อมูลที่มีการเกิดซ้ำสูงสุดหรือมีความถี่สูงสุด หากข้อมูลแต่ละตัวเกิดขึ้นเพียงครั้งเดียวเท่านั้น จะถือว่าไม่มีฐานนิยมในข้อมูลชุดนั้น แต่ถ้ามีข้อมูลหลายตัวที่มีค่าความถี่เท่ากันและเป็นค่าความถี่ที่สูงสุด จะถือว่ามีค่าฐานนิยมได้หลายตัว ตัวอย่างของฐานนิยมแสดงในภาพ
ส่วนค่าไหนจะใช้เมื่อไหร่ ก็ขึ้นอยู่กับสถานการณ์และความเหมาะสม ไว้ถ้ามีโอกาสจะเอามาเล่าให้ฟังอีกที...😊
ภาพและข้อมูลมีเจ้าของ จะใช้กรุณาแจ้งเจ้าของ Blog
Comments
Post a Comment