ข้อมูล ความแปรผัน การสุ่มตัวอย่าง การอนุมาน การถดถอย ความไม่แน่นอน แบบจำลองสถิติ และหลักฐาน

สถิติ

สถิติเปลี่ยนข้อมูลให้เป็นหลักฐานด้วยการอธิบายความแปรผัน ประมาณค่าที่ไม่ทราบ ทดสอบข้อกล่าวอ้าง และวัดความไม่แน่นอน

จุดประสงค์หลัก
สถิติช่วยอธิบายข้อมูล ประมาณค่าที่ไม่ทราบ เปรียบเทียบกลุ่ม และตัดสินว่ายังเหลือความไม่แน่นอนเท่าใด
องค์ประกอบสำคัญ
การสุ่มตัวอย่างสำคัญเพราะข้อมูลมักเป็นตัวแทนเพียงส่วนหนึ่งของประชากรหรือกระบวนการที่ใหญ่กว่า
พบได้ที่ไหน
สถิติสนับสนุนวิทยาศาสตร์ การแพทย์ นโยบายสาธารณะ ธุรกิจ กีฬา เศรษฐศาสตร์ การควบคุมคุณภาพ และแมชชีนเลิร์นนิง
การถดถอยเป็นเครื่องมือทางสถิติชนิดหนึ่งสำหรับอธิบายความสัมพันธ์และความไม่แน่นอนในข้อมูลที่สังเกตได้ดูภาพบน Wikimedia Commons

สถิติศึกษาอะไร

สถิติคือสาขาที่เรียนรู้จากข้อมูล มันถามว่าข้อมูลถูกรวบรวมมาอย่างไร มีรูปแบบใดปรากฏอยู่ มีความแปรผันมากแค่ไหน และข้อสรุปใดสมเหตุสมผล ต่างจากการคำนวณเลขดิบ สถิติทำให้ความไม่แน่นอนยังมองเห็นได้ เพราะข้อมูลมักไม่สมบูรณ์ มีเสียงรบกวน มีอคติ หรือมาจากโลกที่เปลี่ยนแปลงอยู่เสมอ

การอธิบายข้อมูล

สถิติเชิงพรรณนาสรุปสิ่งที่สังเกตได้ ตัววัดเช่นค่าเฉลี่ย มัธยฐาน พิสัย ความแปรปรวน และส่วนเบี่ยงเบนมาตรฐานอธิบายค่ากลางและการกระจาย แผนภูมิเช่นฮิสโตแกรม กราฟกระจาย และแผนภาพกล่องเผยรูปร่าง กลุ่ม ค่าผิดปกติ และความสัมพันธ์ที่ตัวเลขเดียวอาจซ่อนไว้

ตัวอย่างและประชากร

ประชากรคือกลุ่มหรือกระบวนการที่ใหญ่กว่าซึ่งสนใจศึกษา ส่วนตัวอย่างคือข้อมูลที่สังเกตได้จริง ตัวอย่างที่ดีถูกเลือกเพื่อสนับสนุนข้อสรุปเกี่ยวกับประชากร การสุ่มตัวอย่างที่ไม่ดีอาจทำให้การคำนวณที่ดูแม่นยำทำให้เข้าใจผิด เพราะตัวเลขอาจสะท้อนอคติจากการคัดเลือกมากกว่าความเป็นจริงพื้นฐาน

การอนุมาน

การอนุมานทางสถิติใช้ข้อมูลตัวอย่างเพื่อประมาณค่าที่ไม่ทราบหรือประเมินข้อกล่าวอ้าง ช่วงความเชื่อมั่นแสดงช่วงของค่าที่เป็นไปได้ภายใต้แบบจำลอง ส่วนการทดสอบสมมติฐานถามว่าข้อมูลที่สังเกตได้น่าประหลาดใจหรือไม่ภายใต้ข้อสมมติที่กำหนด เครื่องมือเหล่านี้ต้องตีความอย่างระมัดระวัง โดยเฉพาะเมื่อมีการเปรียบเทียบจำนวนมาก

แบบจำลองและข้อสมมติ

แบบจำลองสถิติทำให้ความจริงง่ายลงเพื่อให้วิเคราะห์ข้อมูลได้ แบบจำลองอาจสมมติว่าข้อมูลเป็นอิสระกัน มีการแจกแจงบางแบบ มีความสัมพันธ์เชิงเส้น หรือมีความแปรผันคล้ายกันระหว่างกลุ่ม ข้อสมมติเหล่านี้ไม่ใช่รายละเอียดทางเทคนิคเท่านั้น แต่กำหนดว่าผลลัพธ์หมายความว่าอะไรและการวิเคราะห์เชื่อถือได้หรือไม่

การถดถอยและความสัมพันธ์

การถดถอยศึกษาว่าตัวแปรหนึ่งเปลี่ยนไปพร้อมกับอีกตัวแปรอย่างไรโดยคำนึงถึงความแปรผัน การถดถอยเชิงเส้นประมาณความสัมพันธ์เป็นเส้นตรง แต่การถดถอยยังรองรับเส้นโค้ง หมวดหมู่ จำนวนครั้ง และตัวทำนายหลายตัวได้ ความสัมพันธ์ที่ประมาณได้อาจมีประโยชน์ต่อการพยากรณ์ แต่ไม่ได้พิสูจน์เหตุและผลโดยอัตโนมัติ

สถิติและความน่าจะเป็น

ความน่าจะเป็นและสถิติทำงานคนละทิศทางแต่เชื่อมโยงกัน ความน่าจะเป็นเริ่มจากแบบจำลองแล้วถามว่าข้อมูลอาจหน้าตาเป็นอย่างไร สถิติเริ่มจากข้อมูลแล้วถามว่าแบบจำลองหรือคำอธิบายใดน่าเป็นไปได้ การวิเคราะห์สมัยใหม่มักผสานทั้งสองอย่าง โดยเฉพาะในวิธีแบบเบย์ การจำลอง และแมชชีนเลิร์นนิง

ทำไมมันถึงสำคัญ

สถิติสำคัญเพราะข้อมูลไม่ได้พูดด้วยตัวเอง ชุดข้อมูลเดียวกันอาจสนับสนุนหลักฐานที่แข็งแรง หลักฐานที่อ่อน หรือเรื่องเล่าที่ทำให้เข้าใจผิด ขึ้นอยู่กับว่าข้อมูลถูกรวบรวมและวิเคราะห์อย่างไร การคิดเชิงสถิติช่วยให้ผู้คนตัดสินข้อกล่าวอ้าง วัดความเสี่ยง ออกแบบการศึกษาที่ดีขึ้น และตัดสินใจภายใต้ความไม่แน่นอน