1 min readAug 31, 2017
สถิติ การจัดการข้อมูลแบบพื้นฐานที่สุด
Mean, Median, Mode ย่อข้อมูลเหลือแค่เลขเดียวด้วยค่ากลาง
- Mode: ฐานนิยม: เลขส่วนใหญ่คือค่านั้น หมายถึง ความถี่มากสุด ฐานนิยม สามารถหาได้ในทุกระดับการวัด เช่น สี งานอดิเรก ข้อดี ใช้ได้กับข้อมูลทุกประเภท ข้อเสีย ไม่เป็นตัวแทนที่ดีเท่าไหร่นักถ้าเลขที่มีความถี่มากที่สุด มีค่าแตกต่างจากเลขส่วนใหญ่ และ ฐานนิยมอาจมีได้หลายค่า ทำให้ตัดสินใจไม่ได้ว่าควรใช้ตัวไหน ข้อเสียสำคัญสุดคือ ไม่สามารถนำค่าฐานนิยมไปใช้ในการวิเคราะห์สถิติขั้นสูงๆ เช่น การเปรียบเทียบว่ากลุ่มไหนมากกว่ากัน หรือเปรียบเทียบความสัมพันธ์ได้เลย เราจึงเห็นฐานนิยมในการสรุปผลพื้นฐานเท่านั้น
- Median: มัธยฐาน: ยืนอยู่ตรงกลาง เป็นค่ากลางที่ใช้ระดับข้อมูล Ordinal, Interval หรือ Ratio เท่านั้น ไม่สามารถนำ Nominal มาหา Median ได้ เพราะข้อมูลดังกล่าวไม่สามารถเรียงลำดับได้ว่า ค่าไหนมากกว่าหรือน้อยกว่า หลักการ เพียงนำข้อมูลมาเรียงลำดับต่อแถวกัน จากนั้นเลือกคนที่อยู่ตรงกลางพอดี ข้อดี มีค่าได้เพียงค่าเดียว ใช้หาความแตกต่างระหว่างกลุ่ม และหาความสัมพันธ์ระหว่างข้อมูลได้ ถึงจะมีสถิติที่วิเคราะห์ด้วยมัธยฐานไม่มาก แต่ก็เรียกได้ว่าสามารถใช้ประโยชน์ได้กว้างขึ้นกว่าเยอะ ข้อเสียใกล้เคียงกับ Mode คือ เนื่องจากเราไม่ได้ใช้ค่าของตัวเลขมาใช้ในการคำนวณ เราใช้เพียงลำดับ เราอาจจะพบ Median ที่ออกมาไม่ใช่ตัวแทนของข้อมูลที่ควร เช่น 4 4 4 5 6 7 72 72 72 Median คือ 6 เพราะเป็นเลชที่อยู่ตรงกลาง แต่ถ้าเราสังเกตุให้ดีเราจะพบว่าเลข 6 เองไม่ใช่ตัวแทนที่ดีนัก เพราะคงไม่คิดว่าถ้าเราบอกว่า Median คือ 6 ในกลุ่มของเราจะมีเลข 72 ติดมาด้วย
ตำแหน่ง = (N + 1)/2
โดยที่ N = จำนวนข้อมูลทั้งหมด
- Mean: ค่าเฉลี่ย: บวกกันแล้วหารด้วยจำนวน ค่าเฉลี่ยนั้นได้มาขากเลขทุกตัว จึงถือว่าเป็นค่ากลางที่มีรายละเอียดของข้อมูลอยู่มากที่สุด ดังนั้น ไม่ว่าอย่างไรในกรณีส่วนใหญ่แล้วค่าเฉลี่ยค่อนข้างจะเป็นตัวแทนที่ดีอยู่เสมอ ถึงแม้ว่าต่าเฉลี่ยมักจะได้ค่าเป็นทศนิยม และค่าเฉลี่ยอาจจะไม่มีหน้าตาเหมือนกับข้อมูลส่วนใหญ่เช่นเดียวกับฐานนิยม แต่ค่าเฉลี่ยก็ทำให้ผู้อ่านรู้ว่าค่าของตัวเลขส่วนใหญ่ในข้อมูลนี้นอยู่ที่ราวๆไหน นอกจากนี้ ค่าเฉลี่ยยังเป็นค่ากลางที่สามารถนำไปใช้ในสถิติขั้นสูงกว่าได้มากมาย เพราะค่าเฉลี่ยเป็นค่ากลางเพีบงค่าเดียวที่เป็นตัวเลขแท้ๆ ที่สามารถนำไป บวก ลบ คูณ หาร ได้ สถิติแทบจะส่วนใหญ่จำเป็นต้องใช้ค่าเฉลี่ยแทบทั้งนั้น ไม่ว่าจะเป็นการเปรียบเทียบข้อมูลระหว่างกลุ่ม