Categories: All - สถิติ - มัธยฐาน

by mannika kaewjaranai 4 years ago

295

การคำนวณค่าสถิติ

การวิเคราะห์ข้อมูลทางสถิติเป็นเรื่องสำคัญในการทำความเข้าใจและนำไปใช้ประโยชน์ในด้านต่างๆ หนึ่งในวิธีการวิเคราะห์ที่นิยมใช้คือการหาค่าพิสัย ซึ่งเป็นการวัดการกระจายของข้อมูล โดยคำนวณจากค่าสูงสุดลบค่าต่ำสุด ข้อเสียของการใช้ค่าพิสัยคือ อาจไม่แน่นอนเมื่อใช้กับข้อมูลจำนวนมาก อีกทั้งค่าเหล่านี้ยังขึ้นอยู่กับขนาดของข้อมูล นอกจากนี้ยังมีค่ากึ่งกลางพิสัยซึ่งเป็นค่าเฉลี่ยระหว่างค่าสูงสุดและค่าต่ำสุดที่ช่วยให้เห็นภาพรวมของข้อมูลได้ดีขึ้น การใช้ส่วนเบี่ยงเบนมาตรฐานช่วยบอกการกระจายของข้อมูลได้ดีกว่าค่าพิสัยและค่าส่วนเบี่ยงเบนเฉลี่ย ค่าฐานนิยมเป็นค่าที่ปรากฏบ่อยครั้งในชุดข้อมูล ใช้ได้ทั้งกับข้อมูลเชิงคุณภาพและเชิงปริมาณ ส่วนค่ามัธยฐานเป็นค่ากลางของชุดข้อมูลที่มีการเรียงลำดับ โดยสามารถคำนวณได้จากสูตรที่กำหนด ทำให้สามารถนำมาใช้ในกรณีที่ข้อมูลมีการแจกแจงความถี่ได้อย่างมีประสิทธิภาพ

การคำนวณค่าสถิติ

การคำนวณค่าสถิติ

การวัดการกระจายของข้อมูล การวัดการกระจายสัมบูรณ์ (absolute variation)

การวัดการกระจายของข้อมูลชุดเดียวเพื่อศึกษาว่าข้อมูลแต่ละค่ามีความแตกต่างกันมากน้อยเพียงไรการวัดการกระจายสัมบูรณ์ที่นิยมใช้มี 4 วิธี
4 ส่วนเบี่ยงเบนมาตรฐาน ( Standard Deviation )
3 ส่วนเบี่ยงเบนเฉลี่ย ( Mean Deviation )
2 ส่วนเบี่ยงเบนควอร์ไทล์(Quartile Deviation )
1 พิสัย (Range)

ค่าพิสัย (Range : R)

ข้อเสียของพิสัย
2) ค่าของพิสัยจะขึ้ นอยู่กับขนาดของข้อมูล ถ้าข้อมูลมีจำนวนมาก พิสัยจะมาก ถ้าข้อมูลมีจำนวนน้อยพิสัยจะน้อย
1) ในกรณีใช้พิสัยกับข้อมูลที่มีจำนวนมาก การวัดจะไม่แน่นอน
ค่ากึ่งกลางพิสัย (Mid Range)
ค่ากึ่งกลางพิสัย คือค่าที่ได้จากการนำข้อมูลที่มีค่ามากที่สุดและ น้อยที่สุดมาหาค่าเฉลี่ยเลขคณิต
การวัดค่ากลาง
ตัวแทนของข้อมูลทั้งหมดที่สามารถจะไป ใช้ในการวิเคราะห์
การหาการกระจายของข้อมูลโดยนำข้อมูลที่มีค่าสูงที่สุดลบกับข้อมูลที่มีค่าต่ำที่สุดเพื่อให้ได้ค่าที่เป็นช่วงของการกระจายซึ่งสามารถบอกถึงความกว้างของข้อมูลชุดนั้นๆ สำหรับสูตรที่ใช้ในการหาพิสัย
พิสัย (R) = ค่าสูงสุด – ค่าต่ำสุด
พิสัย (R) = Xmax – Xmin

ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation : S.D)

เป็นค่าวัดการกระจายที่สำคัญทางสถิติ เพราะเป็นค่าที่ใช้บอกถึง การกระจายของข้อมูลได้ดีกว่าค่าพิสัย และค่าส่วนเบี่ยงเบนเฉลี่ย

ค่าฐานนิยม (Mode : Mo)

การหาค่าฐานนิยม(Mo) เมื่อข้อมูลไม่ได้มีการแจกแจงความถี่
ในกรณีที่ข้อมูลไม่ได้มีการแจกแจงความถี่ วิธีการหาค่าฐานนิยม(Mo) สามารถทำได้โดยการนับจำนวนข้อมูล ซึ่งข้อมูลชุดใดมีจำนวนซ้ำกันมากที่สุดก็จะเป็นค่าฐานนิยม
เป็นค่ากลางซึ่งจะนำมาใช้ในกรณี ที่ข้อมูลมีการซ้ำกันมากๆ จนผิดปกติ
สามารถมีค่าได้มากกว่า 1 ค่า
สามารถใช้ได้กับข้อมูลที่เป็นข้อมูลเชิงคุณภาพ (Qualitative) และข้อมูลเชิงปริมาณ(Quantitative)
เป็นค่ากลางหรือตัวแทนของข้อมูลที่สามารถ อธิบายลักษณะที่เกิดขึ้นได้ดีกว่าค่าเฉลี่ยเลขคณิต และค่ามัธยฐาน

ค่ามัธยฐาน (Median)

การหาค่ามัธยฐานของข้อมูลที่แจกแจงความถี่แล้ว สามารถหา ค่ามัธยฐานได้จากสูตรเมื่อจัดเรียงข้อมูลชุดหนึ่งซึ่งมีN ค่า ตำแหน่งของมัธยฐาน
Mdn คือ ค่ามัธยฐาน L0 คือ ขอบเขตล่างของชั้นที่มีมัธยฐานอยู่ i คือ อันตรภาคชั้น (ช่วงห่างของข้อมูลแต่ละชั้น) N คือ จ านวนข้อมูลทั้งหมด Cf คือ ความถี่สะสมที่อยู่ก่อนถึงชั้นที่มีตำแหน่งมัธยฐาน F คือ ความถี่ของคะแนนในชั้นที่มีมัธยฐาน
ขั้นตอนการหาค่ามัธยฐานมี 2 ขั้นตอน ดังนี้
การหาค่ามัธยฐานเมื่อข้อมูลไม่ได้มีการแจกแจงความถี่และมี จำนวนข้อมูลเป็นจำนวนคู่
การหาค่ามัธยฐาน เมื่อข้อมูลไม่ได้มีการแจกแจงความถี่และมี จำนวนข้อมูลเป็นจำนวนคี่
2) ทำการหาตำแหน่งกึ่งกลางของข้อมูลที่ได้จากการหาขั้นตอนที่1
1) เรียงลำดับข้อมูลจากมากไปน้อย หรือจากน้อยไปมาก
เป็นค่ากลางของข้อมูลที่ได้จากการพิจารณาตำแหน่งของข้อมูลที่อยู่ตรงกลางโดยที่
ค่ามัธยฐานยังสามารถใช้เป็นตัวแทนของ ข้อมูลได้เป็นอย่างดี ในกรณีที่ข้อมูลมีการ กระจายที่ผิดปกติ
ข้อมูลต้องทำการเรียงลำดับตามปริมาณ จากมากไปน้อย หรือจากน้อยไปมากก็ได้

ค่าเฉลี่ยเลขคณิต (Arithmetic Mean)

เนื่องจากเราเชื่อว่าในช่วง 21-30 นั้น ย่อมมีทั้งคนที่ได้คะแนนมาก และน้อยอยู่รวมกัน จึงใช้วิธีที่บอกว่าแต่ละตัวมากน้อยเท่าไหร่ไม่รู้ แต่ สุดท้ายต้องเอามารวมกันอยู่ดี เราเลยประมาณได้ว่าทุกตัวมีค่าอยู่ตรง กลางพอดี
ข้อมูลแจกแจงความถี่ คือ ข้อมูลที่ให้มาเป็นช่วงไม่สามารถบอกได้ว่า แต่ละตัวมีค่าเท่าไหร่ เช่น ในช่วง 21- 30 มีจ านวน 10 คน เราไม่ สามารถบอกได้ว่าใน 10 คนนี้ แต่ละคนมีค่าเท่าใด แล้วเราจะหา ผลรวมได้อย่างไร?
ค่าเฉลี่ยเลขคณิตของข้อมูลไม่แจกแจงความถี่ (ungrouped data)
จะใช้กรณีที่มีข้อมูลไม่มากนักและเป็นข้อมูลที่มาจากตัวอย่าง

Subtopic

หลักการการหาค่าเฉลี่ย
ทำได้โดยนำค่าทั้งหมดที่มีรวมกัน แล้วนำมาหารด้วย จำนวนของข้อมูล

ค่าเฉลี่ยเลขคณิตแบบแจกแจงความถี่

ค่าเฉลี่ยเลขคณิตของข้อมูลไม่แจกแจงความถี่

ข้อจำกัด
ถ้าข้อมูลมีการกระจายมาก หรือข้อมูลบางตัวมีค่ามากหรือน้อยจนผิดปกติ หรือข้อมูลมีการเพิ่มขึ้ นเป็นเท่าตัว ค่าเฉลี่ยเลขคณิต จะไม่สามารถเป็ นค่ากลางหรือเป็ นตัวแทนที่ดีของข้อมูลได
นำข้อมูลมาจัดเรียงใหม่จากค่าน้อยไปค่ามากได้ดังนี้ 71, 71, 78, 83, 85, 86, 88, 88,90, 90
จะพบว่าข้อมูลส่วนใหญ่ในช่วง 83 - 88 และค่าต่ำสุดและสูงสุด ของข้อมูลชุดนี้ ต่างกัน 19 คะแนน ดังนั้น ใช้ค่าเฉลี่ยคณิตเป็ นค่ากลาง หรือเป็นตัวแทนชุดนี้ ได้ดี
เหมาะที่จะนำมาใช้เป็นค่ากลางของข้อมูล เมื่อข้อมูล นั้นๆ ไม่มีค่าใดค่าหนึ่งหรือหลายๆ ค่าซึ่งสูงหรือต่ำกว่าค่าอื่นๆ ที่เหลืออย่างผิดปกติ
คะแนนสอบวิชาคณิตศาสตร์ของ นักเรียน 10 คน 71 , 83, 90, 90, 85, 71, 78, 86, 88, 88
ที่เราเรียกกันย่อๆ ว่า ค่าเฉลี่ย เป็นค่ากลาง ทางสถิติค่าหนึ่ง ที่นิยมใช้ในการวิเคราะห์สถิติ
ค่าเฉลี่ยเลขคณิตเป็นค่ากลางหรือเป็นตัวแทน ของข้อมูลที่ดีที่สุด

1)เป็นค่าที่ไม่เอนเอียง 2)เป็นค่าที่มีความคงเส้นคงวา 3)เป็นค่าที่มีความแปรปรวนต่ำที่สุด 4)เป็นค่าที่มีประสิทธิภาพสูงสุด

สถิติที่ใช้ในการวิเคราะห์ข้อมูลในการวิจัย

สถิติสำหรับการทดสอบสมมติฐาน เป็นสถิติที่ใช้สำหรับการวิเคราะห์เพื่อ ทดสอบสมมติฐานว่าเป็นจริงตามที่กำหนดไว้หรือไม่
1.3 การพยากรณ์ (regression)
1.2 การหาความสัมพันธ์ ระหว่างข้อมูลตั้งแต่ 2 ชุดขึ้นไป ได้แก่ การหาการหาสมัประสิทธิ์สหสัมพันธ์(correlation)
1.1 การทดสอบความแตกต่างระหว่างกลุ่ม ได้แก่ t-test F-test และ ไคส แควร์(chi-square)
สถิติพื้นฐาน
สถิติการเพื่อแสดงความหมายทั่วไปของข้อมูล และใช้เป็นฐานข้อมูลในการคคนวณสถิติขั้นสูงต่อไป

1.3 การวัดการกระจาย

ความแปรปรวน (Variance)

ความเบี่ยงเบนมาตรฐาน (Standard Deviation)

พิสัย (Range)

1.2 การวัดแนวโน้มเข้าสู่ส่วนกลาง

ฐานนิยม (Mode)

มัธยฐาน (Median)

ค่าเฉลี่ย (Mean)

1.1 การแจกแจงความถี่ (frequency)