สถิติ
สถิติเปลี่ยนข้อมูลให้เป็นหลักฐานด้วยการอธิบายความแปรผัน ประมาณค่าที่ไม่ทราบ ทดสอบข้อกล่าวอ้าง และวัดความไม่แน่นอน
สถิติศึกษาอะไร
สถิติคือสาขาที่เรียนรู้จากข้อมูล มันถามว่าข้อมูลถูกรวบรวมมาอย่างไร มีรูปแบบใดปรากฏอยู่ มีความแปรผันมากแค่ไหน และข้อสรุปใดสมเหตุสมผล ต่างจากการคำนวณเลขดิบ สถิติทำให้ความไม่แน่นอนยังมองเห็นได้ เพราะข้อมูลมักไม่สมบูรณ์ มีเสียงรบกวน มีอคติ หรือมาจากโลกที่เปลี่ยนแปลงอยู่เสมอ
การอธิบายข้อมูล
สถิติเชิงพรรณนาสรุปสิ่งที่สังเกตได้ ตัววัดเช่นค่าเฉลี่ย มัธยฐาน พิสัย ความแปรปรวน และส่วนเบี่ยงเบนมาตรฐานอธิบายค่ากลางและการกระจาย แผนภูมิเช่นฮิสโตแกรม กราฟกระจาย และแผนภาพกล่องเผยรูปร่าง กลุ่ม ค่าผิดปกติ และความสัมพันธ์ที่ตัวเลขเดียวอาจซ่อนไว้
ตัวอย่างและประชากร
ประชากรคือกลุ่มหรือกระบวนการที่ใหญ่กว่าซึ่งสนใจศึกษา ส่วนตัวอย่างคือข้อมูลที่สังเกตได้จริง ตัวอย่างที่ดีถูกเลือกเพื่อสนับสนุนข้อสรุปเกี่ยวกับประชากร การสุ่มตัวอย่างที่ไม่ดีอาจทำให้การคำนวณที่ดูแม่นยำทำให้เข้าใจผิด เพราะตัวเลขอาจสะท้อนอคติจากการคัดเลือกมากกว่าความเป็นจริงพื้นฐาน
การอนุมาน
การอนุมานทางสถิติใช้ข้อมูลตัวอย่างเพื่อประมาณค่าที่ไม่ทราบหรือประเมินข้อกล่าวอ้าง ช่วงความเชื่อมั่นแสดงช่วงของค่าที่เป็นไปได้ภายใต้แบบจำลอง ส่วนการทดสอบสมมติฐานถามว่าข้อมูลที่สังเกตได้น่าประหลาดใจหรือไม่ภายใต้ข้อสมมติที่กำหนด เครื่องมือเหล่านี้ต้องตีความอย่างระมัดระวัง โดยเฉพาะเมื่อมีการเปรียบเทียบจำนวนมาก
แบบจำลองและข้อสมมติ
แบบจำลองสถิติทำให้ความจริงง่ายลงเพื่อให้วิเคราะห์ข้อมูลได้ แบบจำลองอาจสมมติว่าข้อมูลเป็นอิสระกัน มีการแจกแจงบางแบบ มีความสัมพันธ์เชิงเส้น หรือมีความแปรผันคล้ายกันระหว่างกลุ่ม ข้อสมมติเหล่านี้ไม่ใช่รายละเอียดทางเทคนิคเท่านั้น แต่กำหนดว่าผลลัพธ์หมายความว่าอะไรและการวิเคราะห์เชื่อถือได้หรือไม่
การถดถอยและความสัมพันธ์
การถดถอยศึกษาว่าตัวแปรหนึ่งเปลี่ยนไปพร้อมกับอีกตัวแปรอย่างไรโดยคำนึงถึงความแปรผัน การถดถอยเชิงเส้นประมาณความสัมพันธ์เป็นเส้นตรง แต่การถดถอยยังรองรับเส้นโค้ง หมวดหมู่ จำนวนครั้ง และตัวทำนายหลายตัวได้ ความสัมพันธ์ที่ประมาณได้อาจมีประโยชน์ต่อการพยากรณ์ แต่ไม่ได้พิสูจน์เหตุและผลโดยอัตโนมัติ
สถิติและความน่าจะเป็น
ความน่าจะเป็นและสถิติทำงานคนละทิศทางแต่เชื่อมโยงกัน ความน่าจะเป็นเริ่มจากแบบจำลองแล้วถามว่าข้อมูลอาจหน้าตาเป็นอย่างไร สถิติเริ่มจากข้อมูลแล้วถามว่าแบบจำลองหรือคำอธิบายใดน่าเป็นไปได้ การวิเคราะห์สมัยใหม่มักผสานทั้งสองอย่าง โดยเฉพาะในวิธีแบบเบย์ การจำลอง และแมชชีนเลิร์นนิง
ทำไมมันถึงสำคัญ
สถิติสำคัญเพราะข้อมูลไม่ได้พูดด้วยตัวเอง ชุดข้อมูลเดียวกันอาจสนับสนุนหลักฐานที่แข็งแรง หลักฐานที่อ่อน หรือเรื่องเล่าที่ทำให้เข้าใจผิด ขึ้นอยู่กับว่าข้อมูลถูกรวบรวมและวิเคราะห์อย่างไร การคิดเชิงสถิติช่วยให้ผู้คนตัดสินข้อกล่าวอ้าง วัดความเสี่ยง ออกแบบการศึกษาที่ดีขึ้น และตัดสินใจภายใต้ความไม่แน่นอน