3.4 จะถามใคร

ยุคดิจิตอลกำลังสร้างความเป็นไปได้ในการสุ่มตัวอย่างในทางปฏิบัติอย่างหนักและกำลังสร้างโอกาสใหม่ ๆ สำหรับการสุ่มตัวอย่างที่ไม่น่าจะเป็นไปได้

ในประวัติศาสตร์ของการสุ่มตัวอย่างมีสองวิธีการแข่งขันคือวิธีสุ่มตัวอย่างความน่าจะเป็นและวิธีการสุ่มตัวอย่างที่ไม่น่าจะเป็น แม้ว่าทั้งสองวิธีจะถูกนำมาใช้ในวันแรก ๆ ของการสุ่มตัวอย่างการสุ่มตัวอย่างความน่าจะเป็นจุดเริ่มต้นและนักวิจัยทางสังคมหลายคนได้รับคำแนะนำในการดูตัวอย่างที่ไม่น่าจะเป็นด้วยความสงสัย อย่างไรก็ตามตามที่ฉันจะอธิบายด้านล่างการเปลี่ยนแปลงที่สร้างขึ้นโดยยุคดิจิทัลหมายความว่าถึงเวลาที่นักวิจัยจะพิจารณาตัวอย่างที่ไม่น่าจะเป็นอีกต่อไป โดยเฉพาะอย่างยิ่งการสุ่มตัวอย่างเป็นเรื่องยากที่จะทำในทางปฏิบัติและการสุ่มตัวอย่างที่ไม่ใช่ความน่าจะเป็นไปได้เร็วขึ้นถูกกว่าและดีขึ้น การสำรวจที่รวดเร็วและถูกกว่าไม่เพียงแค่สิ้นสุดลงในตัวเองเท่านั้น แต่ยังช่วยให้โอกาสใหม่ ๆ เช่นการสำรวจบ่อยขึ้นและขนาดตัวอย่างที่ใหญ่ขึ้น ตัวอย่างเช่นโดยใช้วิธีการที่ไม่น่าจะเป็นวิธีการที่การศึกษาการเลือกตั้งรัฐสภาสหกรณ์ (CCES) สามารถมีผู้เข้าร่วมประมาณ 10 ครั้งมากกว่าการศึกษาก่อนหน้าโดยใช้การสุ่มตัวอย่างความน่าจะเป็น กลุ่มตัวอย่างจำนวนมากนี้ช่วยให้นักวิจัยทางการเมืองสามารถศึกษารูปแบบทัศนคติและพฤติกรรมในกลุ่มย่อยและบริบททางสังคมได้ นอกจากนี้ทุกระดับที่เพิ่มขึ้นนี้มาโดยไม่มีการลดลงในคุณภาพของการประมาณการ (Ansolabehere and Rivers 2013)

ปัจจุบันวิธีการที่สำคัญในการสุ่มตัวอย่างสำหรับการวิจัยทางสังคมคือ การสุ่มตัวอย่างความน่าจะ เป็น ในการสุ่มตัวอย่างประชากรทั้งหมดของกลุ่มเป้าหมายมีความเป็นไปได้ที่จะถูกสุ่มตัวอย่างและทุกคนที่ได้รับการสุ่มตัวอย่างตอบแบบสอบถาม เมื่อเงื่อนไขเหล่านี้ได้รับการตอบสนองผลทางคณิตศาสตร์ที่สง่างามมีการค้ำประกันที่สามารถพิสูจน์ได้เกี่ยวกับความสามารถของนักวิจัยในการใช้ตัวอย่างเพื่อหาข้อสรุปเกี่ยวกับกลุ่มเป้าหมาย

อย่างไรก็ตามในโลกแห่งความเป็นจริงเงื่อนไขที่ทำให้ผลการคำนวณทางคณิตศาสตร์เหล่านี้ไม่ค่อยเกิดขึ้น ตัวอย่างเช่นมักมีข้อผิดพลาดเกี่ยวกับความครอบคลุมและไม่ตอบสนอง เนื่องจากปัญหาเหล่านี้นักวิจัยมักต้องใช้ความหลากหลายของการปรับสถิติเพื่อให้การอนุมานจากตัวอย่างของพวกเขาไปยังกลุ่มเป้าหมายของพวกเขา ดังนั้นจึงเป็นสิ่งสำคัญที่จะแยกแยะระหว่าง การสุ่มตัวอย่างความน่าจะเป็นในทางทฤษฎี ซึ่งมีการรับประกันทฤษฎีที่แข็งแกร่งและ การสุ่มตัวอย่างความเป็นไปได้ในทางปฏิบัติ ซึ่งไม่มีการรับประกันดังกล่าวและขึ้นอยู่กับความหลากหลายของการปรับสถิติ

เมื่อเวลาผ่านไปความแตกต่างระหว่างการสุ่มตัวอย่างในทฤษฎีและการสุ่มตัวอย่างความเป็นไปได้ในทางปฏิบัติเพิ่มขึ้น ตัวอย่างเช่นอัตราการไม่ตอบสนองได้เพิ่มขึ้นเรื่อย ๆ แม้ในการสำรวจที่มีคุณภาพสูงและมีราคาแพง (รูปที่ 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) อัตราการไม่ตอบสนองสูงกว่าในการสำรวจทางโทรศัพท์เชิงพาณิชย์ซึ่งบางครั้งก็สูงถึง 90% (Kohut et al. 2012) การเพิ่มขึ้นของ nonresponse เหล่านี้คุกคามต่อคุณภาพของการประมาณการเนื่องจากการประมาณการขึ้นกับแบบจำลองทางสถิติที่นักวิจัยใช้ในการปรับค่าใช้จ่ายสำหรับ nonresponse นอกจากนี้การลดลงของคุณภาพเหล่านี้ยังเกิดขึ้นแม้จะมีความพยายามเพิ่มขึ้นอย่างมากโดยนักวิจัยด้านการสำรวจเพื่อรักษาอัตราการตอบสนองที่สูง บางคนกลัวว่าแนวโน้มคู่ของการลดคุณภาพและต้นทุนที่เพิ่มขึ้นคุกคามรากฐานของการวิจัยเชิงสำรวจ (National Research Council 2013)

รูปที่ 3.5: การไม่ตอบสนองได้เพิ่มมากขึ้นเรื่อย ๆ แม้ในการสำรวจที่มีราคาสูงคุณภาพสูง (National Research Council 2013; B. D. Meyer, Mok และ Sullivan 2015) อัตราการไม่ตอบสนองสูงกว่าสำหรับการสำรวจโทรศัพท์เชิงพาณิชย์ซึ่งบางครั้งก็สูงถึง 90% (Kohut et al. 2012) แนวโน้มระยะยาวใน nonresponse นี้หมายความว่าการเก็บรวบรวมข้อมูลจะมีราคาแพงกว่าและการประมาณการมีความน่าเชื่อถือน้อยกว่า ดัดแปลงจาก B. D. Meyer, Mok และ Sullivan (2015), รูปที่ 1

รูปที่ 3.5: การไม่ตอบสนองได้เพิ่มมากขึ้นเรื่อย ๆ แม้ในการสำรวจที่มีราคาสูงคุณภาพสูง (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) อัตราการไม่ตอบสนองสูงกว่าสำหรับการสำรวจโทรศัพท์เชิงพาณิชย์ซึ่งบางครั้งก็สูงถึง 90% (Kohut et al. 2012) แนวโน้มระยะยาวใน nonresponse นี้หมายความว่าการเก็บรวบรวมข้อมูลจะมีราคาแพงกว่าและการประมาณการมีความน่าเชื่อถือน้อยกว่า ปรับตัวจาก BD Meyer, Mok, and Sullivan (2015) , รูปที่ 1

ในเวลาเดียวกันที่มีการเพิ่มความยากลำบากในการสุ่มตัวอย่างวิธีการสุ่มตัวอย่างยังมีการพัฒนาที่น่าตื่นเต้นใน วิธีการสุ่มตัวอย่างที่ไม่น่าจะ เป็น มีหลายรูปแบบของวิธีการสุ่มตัวอย่างที่ไม่ใช่ความน่าจะเป็น แต่สิ่งหนึ่งที่พวกเขามีเหมือนกันคือไม่สามารถพอดีกับกรอบทางคณิตศาสตร์ของการสุ่มตัวอย่างความน่าจะเป็น (Baker et al. 2013) กล่าวอีกนัยหนึ่งในวิธีการสุ่มตัวอย่างแบบไม่น่าจะไม่ใช่ทุกคนมีความเป็นไปได้ในการรวม วิธีการสุ่มตัวอย่างไม่น่าจะมีชื่อเสียงแย่มากในหมู่นักวิจัยทางสังคมและเกี่ยวข้องกับความล้มเหลวที่น่าทึ่งที่สุดของนักวิจัยด้านการสำรวจเช่นความล้มเหลวในการอ่าน วรรณกรรม (กล่าวถึงก่อนหน้านี้) และ "Dewey Defeats Truman" การคาดการณ์ที่ไม่ถูกต้องเกี่ยวกับสหรัฐฯ การเลือกตั้งประธานาธิบดีเมื่อปีพ. ศ. 2491 (ภาพที่ 3.6)

รูปที่ 3.6: ประธานาธิบดีแฮร์รี่ทรูแมนจับหัวกระดาษหนังสือพิมพ์ที่ประกาศความพ่ายแพ้อย่างไม่ถูกต้อง พาดหัวนี้เป็นส่วนหนึ่งของการประเมินจากตัวอย่างที่ไม่น่าจะเป็นไปได้ (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) แม้ว่า Dewey Defeats Truman เกิดขึ้นในปี 1948 แต่ก็ยังเป็นเหตุผลที่นักวิจัยบางคนสงสัยเกี่ยวกับการประมาณค่าจากตัวอย่างที่ไม่น่าจะเป็นไปได้ แหล่งที่มา: ห้องสมุดและพิพิธภัณฑ์ Harry S. Truman

รูปที่ 3.6: ประธานาธิบดีแฮร์รี่ทรูแมนจับหัวกระดาษหนังสือพิมพ์ที่ประกาศความพ่ายแพ้อย่างไม่ถูกต้อง พาดหัวนี้เป็นส่วนหนึ่งของการประเมินจากตัวอย่างที่ไม่น่าจะเป็นไปได้ (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) แม้ว่า "Dewey Defeats Truman" เกิดขึ้นในปี 1948 แต่ก็ยังเป็นเหตุผลที่นักวิจัยบางคนสงสัยเกี่ยวกับการประมาณค่าจากตัวอย่างที่ไม่น่าจะเป็นไปได้ แหล่งที่มา: ห้องสมุดและพิพิธภัณฑ์ Harry S. Truman

รูปแบบหนึ่งของการสุ่มตัวอย่างที่ไม่น่าจะเป็นที่เหมาะกับยุคดิจิทัลคือการใช้งาน แผงควบคุมแบบออนไลน์ นักวิจัยที่ใช้แผงควบคุมแบบออนไลน์ขึ้นอยู่กับผู้ให้บริการแผงบางรายซึ่งโดยปกติจะเป็น บริษัท รัฐบาลหรือมหาวิทยาลัยเพื่อสร้างกลุ่มคนที่หลากหลายและมีความหลากหลายที่จะตอบแบบสำรวจความคิดเห็น ผู้เข้าร่วมการประชุมเหล่านี้มักได้รับการคัดเลือกโดยใช้วิธีการเฉพาะต่างๆเช่นโฆษณาแบนเนอร์ออนไลน์ จากนั้นนักวิจัยสามารถจ่ายเงินให้ผู้ให้บริการแผงเพื่อเข้าถึงตัวอย่างของผู้ตอบที่มีลักษณะที่ต้องการ (เช่นตัวแทนระดับประเทศของผู้ใหญ่) แผงออนไลน์เหล่านี้เป็นวิธีการที่ไม่ใช่ความน่าจะเป็นเพราะทุกคนไม่รู้จักความเป็นไปได้ที่จะถูกรวมไว้ แม้ว่าจะมีนักวิจัยทางสังคมใช้งานแผงข้อมูลแบบไม่น่าจะเป็นแบบออนไลน์ (เช่น CCES) แต่ก็ยังมีข้อถกเถียงเกี่ยวกับคุณภาพของการประมาณการที่มาจากพวกเขา (Callegaro et al. 2014)

แม้จะมีการอภิปรายเหล่านี้ผมคิดว่ามีสองเหตุผลที่ว่าทำไมเวลาถึงเหมาะสมสำหรับนักวิจัยทางสังคมในการพิจารณาตัวอย่างที่ไม่น่าจะเป็นอีกต่อไป ประการแรกในยุคดิจิทัลมีการพัฒนาหลายอย่างในการรวบรวมและวิเคราะห์ตัวอย่างที่ไม่น่าจะเป็น วิธีการใหม่นี้มีความแตกต่างจากวิธีการที่ก่อให้เกิดปัญหาในอดีตที่ผ่านมาซึ่งคิดว่าเป็นการคิดว่า "การสุ่มตัวอย่างที่ไม่น่าจะเป็น 2.0" เหตุผลประการที่สองนักวิจัยควรพิจารณาตัวอย่างที่ไม่น่าจะเป็นเพราะการสุ่มตัวอย่างใน การปฏิบัติจะกลายเป็นเรื่องยากมากขึ้น เมื่อมีอัตราการตอบสนองที่ไม่สูงมากเท่าที่มีอยู่ในการสำรวจจริงตอนนี้ความเป็นไปได้ที่แท้จริงของการรวมสำหรับผู้ตอบแบบสอบถามไม่เป็นที่รู้จักและทำให้ตัวอย่างความน่าจะเป็นและตัวอย่างที่ไม่น่าจะเป็นไม่แตกต่างกับที่นักวิจัยหลายคนเชื่อ

ดังที่ได้กล่าวไปแล้วตัวอย่างที่ไม่น่าจะถูกมองด้วยความกังขาที่ยิ่งใหญ่โดยนักวิจัยทางสังคมหลายคนส่วนหนึ่งเนื่องจากบทบาทของพวกเขาในความล้มเหลวที่น่าอับอายที่สุดบางส่วนในวันแรก ๆ ของการสำรวจงานวิจัย ตัวอย่างที่ชัดเจนว่าเรามีตัวอย่างมากน้อยแค่ไหนคืองานวิจัยของ Wei Wang, David Rothschild, Sharad Goel และ Andrew Gelman (2015) ที่ได้ผลการเลือกตั้งสหรัฐในปี 2012 อย่างถูกต้องโดยใช้ตัวอย่างที่ไม่น่าจะเป็นของ ผู้ใช้ Xbox อเมริกัน - ตัวอย่างอเมริกันอย่างแน่วแน่ของชาวอเมริกัน นักวิจัยได้คัดเลือกผู้ตอบแบบสอบถามจากระบบเกม Xbox และคาดหวังว่าจะได้ตัวอย่าง Xbox ที่บิดเบี้ยวตัวผู้และตัวเล็ก: เด็กวัย 18-28 ปีขึ้นไป 19% ของผู้ลงคะแนนเสียง แต่ 65% ของตัวอย่าง Xbox และผู้ชาย ทำขึ้น 47% ของผู้มีสิทธิ์เลือกตั้ง แต่ 93% ของ Xbox ตัวอย่าง (รูปที่ 3.7) เนื่องจากข้อมูลเหล่านี้มีความลำเอียงทางด้านประชากรศาสตร์ที่รุนแรงข้อมูลดิบ Xbox จึงเป็นตัวบ่งชี้ถึงผลตอบแทนการเลือกตั้งที่ไม่ดี มันทำนายชัยชนะที่แข็งแกร่งสำหรับนวมรอมนีย์มากกว่า Barack Obama นี่เป็นอีกตัวอย่างหนึ่งของอันตรายของดิบไม่ได้ปรับตัวอย่างที่ไม่น่าจะเป็นไปได้และช่วยเตือนความทรงจำของ วรรณกรรมสำคัญ

รูปที่ 3.7: ข้อมูลประชากรของผู้ตอบแบบสอบถามใน W. Wang et al. (2015) เนื่องจากผู้ตอบแบบสอบถามได้รับคัดเลือกจาก XBox พวกเขามีแนวโน้มที่จะเป็นเด็กและมีแนวโน้มที่จะเป็นเพศชายเมื่อเทียบกับผู้มีสิทธิเลือกตั้งในการเลือกตั้งปี 2012 ดัดแปลงมาจาก W. วังและคณะ (ปี 2015) รูปที่ 1

รูปที่ 3.7: ข้อมูลประชากรของผู้ตอบแบบสอบถามใน W. Wang et al. (2015) เนื่องจากผู้ตอบแบบสอบถามได้รับคัดเลือกจาก XBox พวกเขามีแนวโน้มที่จะเป็นเด็กและมีแนวโน้มที่จะเป็นเพศชายเมื่อเทียบกับผู้มีสิทธิเลือกตั้งในการเลือกตั้งปี 2012 ดัดแปลงมาจาก W. Wang et al. (2015) รูปที่ 1

อย่างไรก็ตามวังและเพื่อนร่วมงานตระหนักถึงปัญหาเหล่านี้และพยายามปรับตัวให้เข้ากับกระบวนการสุ่มตัวอย่างแบบไม่สุ่มตัวอย่างเมื่อทำการประมาณค่า โดยเฉพาะอย่างยิ่งพวกเขาใช้ การแบ่งชั้นหลัง ซึ่งเป็นเทคนิคที่ใช้กันอย่างแพร่หลายในการปรับตัวอย่างความน่าจะเป็นที่มีข้อผิดพลาดในการครอบคลุมและการไม่ตอบสนอง

แนวคิดหลักของการแบ่งชั้นหลังคือการใช้ข้อมูลเสริมเกี่ยวกับกลุ่มเป้าหมายเพื่อช่วยปรับปรุงการประมาณค่าที่มาจากกลุ่มตัวอย่าง เมื่อใช้การแบ่งชั้นหลังเพื่อหาค่าประมาณจากตัวอย่างที่ไม่ใช่ความน่าจะเป็นของพวกเขาวังและเพื่อนร่วมงานก็สับประชากรในกลุ่มต่างๆประเมินการสนับสนุนโอบามาในแต่ละกลุ่มและใช้ค่าเฉลี่ยถ่วงน้ำหนักของกลุ่มที่คาดว่าจะสร้างค่าประมาณโดยรวม ตัวอย่างเช่นพวกเขาอาจแบ่งประชากรออกเป็นสองกลุ่ม (ชายและหญิง) ประมาณการสนับสนุนโอบามาระหว่างชายและหญิงและประเมินว่าโดยรวมแล้วจะสนับสนุนโอบามาด้วยการถัวเฉลี่ยถ่วงน้ำหนักเพื่อที่จะกล่าวถึงข้อเท็จจริงที่ผู้หญิงทำ ขึ้น 53% ของผู้มีสิทธิเลือกตั้งและผู้ชาย 47% ประมาณหลังการแบ่งชั้นจะช่วยให้ถูกต้องสำหรับตัวอย่างที่ขาดไม่ได้โดยการนำข้อมูลเสริมเกี่ยวกับขนาดของกลุ่ม

กุญแจหลังการแบ่งชั้นคือการสร้างกลุ่มที่ถูกต้อง ถ้าคุณสามารถสับประชากรให้กลายเป็นกลุ่มที่เป็นเนื้อเดียวกันได้เช่นการตอบสนองที่เหมือนกันสำหรับทุกคนในแต่ละกลุ่มแล้วการแบ่งชั้นภายหลังจะก่อให้เกิดการประมาณการที่เป็นกลาง กล่าวอีกนัยหนึ่งหลังแบ่งชั้นตามเพศจะให้ค่าประมาณที่เป็นกลางถ้าผู้ชายทุกคนมีแนวโน้มในการตอบสนองและผู้หญิงทุกคนมีแนวโน้มในการตอบสนองเช่นเดียวกัน สมมติฐานนี้เรียกว่าสมมุติฐาน เหมือนกัน - การตอบสนอง - propensities - ภายในกลุ่ม และฉันอธิบายมันอีกเล็กน้อยในบันทึกทางคณิตศาสตร์ที่ส่วนท้ายของบทนี้

แน่นอนว่าดูเหมือนว่าไม่น่าจะเป็นไปได้ว่าการตอบโต้จะเหมือนกันสำหรับผู้ชายและผู้หญิงทุกคน อย่างไรก็ตามการสันนิษฐานว่าเป็นเนื้อเดียวกัน - ตอบสนอง - propensities - ภายในกลุ่มมีแนวโน้มที่จะเป็นไปได้มากขึ้นเนื่องจากจำนวนของกลุ่มเพิ่มขึ้น ประมาณจะกลายเป็นเรื่องง่ายที่จะสับประชากรเป็นกลุ่มที่เป็นเนื้อเดียวกันถ้าคุณสร้างกลุ่มมากขึ้น ตัวอย่างเช่นอาจดูเหมือนไม่น่าเชื่อว่าผู้หญิงทุกคนมีแนวโน้มในการตอบสนองเช่นเดียวกัน แต่น่าจะเป็นไปได้ว่ามีแนวโน้มในการตอบสนองเช่นเดียวกันสำหรับผู้หญิงทุกวัยที่อายุระหว่าง 18-29 ปีซึ่งจบการศึกษาจากวิทยาลัยและอาศัยอยู่ในแคลิฟอร์เนีย . ดังนั้นเนื่องจากจำนวนกลุ่มที่ใช้ในการแบ่งชั้นภายหลังจึงมีขนาดใหญ่สมมติฐานที่จำเป็นในการสนับสนุนวิธีนี้มีความสมเหตุสมผลมากขึ้น จากข้อเท็จจริงนี้นักวิจัยมักต้องการสร้างกลุ่มจำนวนมากสำหรับการแบ่งชั้นหลัง อย่างไรก็ตามเนื่องจากจำนวนของกลุ่มเพิ่มขึ้นนักวิจัยจึงประสบปัญหาที่แตกต่างกัน ได้แก่ การมีข้อมูลน้อยมาก ถ้ามีเพียงกลุ่มเล็ก ๆ ในแต่ละกลุ่มค่าประมาณจะไม่แน่นอนมากขึ้นและในกรณีสุดขีดที่มีกลุ่มที่ไม่มีผู้ตอบแบบสอบถามแล้วการแบ่งชั้นหลังแบ่งออกเป็นส่วน ๆ

มีสองวิธีออกจากความตึงเครียดโดยธรรมชาติระหว่างความเป็นไปได้ของสมมติฐานการตอบสนองความชอบธรรม - ภายในกลุ่มและความต้องการขนาดตัวอย่างที่เหมาะสมในแต่ละกลุ่ม ประการแรกนักวิจัยสามารถเก็บตัวอย่างขนาดใหญ่ขึ้นและมีความหลากหลายมากขึ้นซึ่งจะช่วยให้มั่นใจได้ว่ามีขนาดตัวอย่างที่เหมาะสมในแต่ละกลุ่ม ประการที่สองพวกเขาสามารถใช้แบบจำลองทางสถิติที่ซับซ้อนมากขึ้นสำหรับการประมาณค่าภายในกลุ่ม และในความเป็นจริงนักวิจัยบางคนทำทั้งสองอย่างเช่นวังและเพื่อนร่วมงานทำกับการศึกษาเกี่ยวกับการเลือกตั้งโดยใช้ผู้ตอบจาก Xbox

เนื่องจากพวกเขาใช้วิธีการสุ่มตัวอย่างที่ไม่ใช่ความน่าจะเป็นด้วยการสัมภาษณ์ด้วยคอมพิวเตอร์ (ฉันจะพูดถึงการสัมภาษณ์คอมพิวเตอร์ในบทที่ 3.5) วังและเพื่อนร่วมงานมีข้อมูลที่ไม่แพงมากซึ่งช่วยให้พวกเขารวบรวมข้อมูลจาก 345,858 คนที่ไม่ซ้ำกัน เป็นจำนวนมากตามมาตรฐานการเลือกตั้ง ขนาดตัวอย่างขนาดใหญ่นี้ช่วยให้พวกเขาสร้างกลุ่มชนชั้นโพสต์ได้มากขึ้น ในขณะที่การโพสต์การแบ่งชั้นมักเกี่ยวข้องกับการสับประชากรลงสู่กลุ่มต่างๆนับร้อยกลุ่มวังและเพื่อนร่วมงานแบ่งประชากรออกเป็น 176,256 กลุ่มตามเพศ (2 หมวด) เชื้อชาติ (4 ประเภท) อายุ (4 ประเภท) การศึกษา (4 ประเภท) รัฐ (51 หมวด), ID ของบุคคล (3 หมวดหมู่), อุดมการณ์ (3 หมวดหมู่), และ 2008 vote (3 categories) กล่าวอีกนัยหนึ่งขนาดตัวอย่างขนาดใหญ่ของพวกเขาซึ่งถูกใช้โดยการรวบรวมข้อมูลต้นทุนต่ำช่วยให้พวกเขาสามารถสร้างสมมติฐานที่เป็นไปได้มากขึ้นในกระบวนการประมาณค่าของพวกเขา

ถึงแม้จะมีผู้เข้าร่วมที่ไม่ซ้ำกัน 345,858 คน แต่ยังคงมีหลายกลุ่มที่วังและเพื่อนร่วมงานเกือบจะไม่มีผู้ตอบแบบสอบถาม ดังนั้นจึงใช้เทคนิคที่เรียกว่า การถดถอยหลายระดับ เพื่อประมาณการสนับสนุนในแต่ละกลุ่ม โดยพื้นฐานแล้วการประมาณการการสนับสนุนโอบามาภายในกลุ่มเฉพาะการถดถอยหลายระดับรวบรวมข้อมูลจากกลุ่มที่เกี่ยวข้องกันหลายกลุ่ม ตัวอย่างเช่นลองจินตนาการว่ากำลังพยายามประเมินการสนับสนุนโอบามาระหว่างหญิงชาวละตินอายุระหว่าง 18 ถึง 29 ปีซึ่งเป็นผู้สำเร็จการศึกษาจากวิทยาลัยซึ่งเป็นสมาชิกพรรคเดโมแครตที่ลงทะเบียนแล้วซึ่งเป็นผู้ที่ระบุตัวเองว่าเป็นผู้ดูแลและผู้ที่โหวตให้โอบามาในปี 2008 นี่เป็น , กลุ่มที่เฉพาะเจาะจงมากและเป็นไปได้ว่าไม่มีใครในตัวอย่างที่มีลักษณะเหล่านี้ ดังนั้นในการประมาณค่ากลุ่มนี้การถดถอยหลายระดับใช้แบบจำลองทางสถิติเพื่อรวบรวมข้อมูลประมาณการจากคนในกลุ่มที่คล้ายกันมาก

ดังนั้น Wang และเพื่อนร่วมงานใช้วิธีการที่รวมการถดถอยหลายระดับและโพสต์ - แบ่งชั้นดังนั้นพวกเขาจึงเรียกว่า การถดถอยหลายระดับ ของกลยุทธ์ กับการแบ่งชั้นหลัง หรือความเสน่หา "นาย P. เมื่อวังและเพื่อนร่วมงานใช้นายพีเพื่อทำการประเมินค่าจากกลุ่มตัวอย่างที่ไม่น่าจะเป็น XBO พวกเขาได้ประมาณการใกล้เคียงกับการสนับสนุนโดยรวมที่โอบามาได้รับในการเลือกตั้งปี 2555 (รูปที่ 3.8) ในความเป็นจริงการประมาณการของพวกเขามีความถูกต้องมากกว่าการสำรวจความคิดเห็นสาธารณะแบบดั้งเดิม ดังนั้นในกรณีนี้การปรับสถิติ - โดยเฉพาะนาย P. - ดูเหมือนจะทำงานได้ดีในการแก้ไขอคติในข้อมูลที่ไม่ใช่ความน่าจะเป็น อคติที่มองเห็นได้ชัดเจนเมื่อคุณดูค่าประมาณจากข้อมูล Xbox ที่ไม่ได้ปรับแต่ง

รูปที่ 3.8: ประมาณการจาก W. Wang และคณะ (2015) ตัวอย่าง XBox ที่ไม่ได้ปรับแต่งทำประมาณการที่ไม่ถูกต้อง แต่ตัวอย่างของ Xbox Box ที่ถ่วงน้ำหนักได้สร้างการประมาณค่าที่แม่นยำกว่าค่าเฉลี่ยของการสำรวจทางโทรศัพท์ที่ใช้ความน่าจะเป็น ดัดแปลงมาจาก W. วังและคณะ (ปี 2015) ตัวเลขที่ 2 และ 3

รูปที่ 3.8: ประมาณการจาก W. Wang et al. (2015) ตัวอย่าง XBox ที่ไม่ได้ปรับแต่งทำประมาณการที่ไม่ถูกต้อง แต่ตัวอย่างของ Xbox Box ที่ถ่วงน้ำหนักได้สร้างการประมาณค่าที่แม่นยำกว่าค่าเฉลี่ยของการสำรวจทางโทรศัพท์ที่ใช้ความน่าจะเป็น ดัดแปลงมาจาก W. Wang et al. (2015) ตัวเลขที่ 2 และ 3

มีสองบทเรียนหลักจากการศึกษาของวังและเพื่อนร่วมงาน อันดับแรกตัวอย่างที่ไม่ใช่ความน่าจะเป็นที่ไม่ถูกปรับแต่งอาจนำไปสู่การประมาณการที่ไม่ดี นี่เป็นบทเรียนที่นักวิจัยเคยได้ยินมาก่อน อย่างไรก็ตามบทเรียนที่สองคือตัวอย่างที่ไม่น่าจะเป็นเมื่อวิเคราะห์อย่างถูกต้องสามารถประมาณการที่ดีได้ ตัวอย่างที่ไม่ใช่ความน่าจะเป็นไม่จำเป็นต้องนำไปสู่สิ่งที่คล้ายคลึงกับ Literas Digest fiasco โดยอัตโนมัติ

นับจากนี้ไปถ้าคุณกำลังตัดสินใจเลือกใช้วิธีสุ่มตัวอย่างความน่าจะเป็นและวิธีสุ่มตัวอย่างที่ไม่น่าจะเป็นทางเลือกที่ยาก บางครั้งนักวิจัยต้องการกฎที่รวดเร็วและเข้มงวด (เช่นเคยใช้วิธีสุ่มตัวอย่างความน่าจะเป็น) แต่ก็ยากที่จะเสนอกฎเช่นนี้ นักวิจัยต้องเผชิญกับทางเลือกที่ยากระหว่างวิธีการสุ่มตัวอย่างความน่าจะเป็นแบบฝึกหัดซึ่งมีราคาแพงมากขึ้นและห่างไกลจากผลการทดลองที่ใช้วิธีการสุ่มตัวอย่างการใช้และไม่ใช่ความน่าจะเป็นซึ่งราคาถูกกว่าและเร็วกว่า แต่ไม่คุ้นเคยและแตกต่างกันไปมากขึ้น สิ่งหนึ่งที่ชัดเจนก็คือถ้าคุณถูกบังคับให้ทำงานร่วมกับตัวอย่างที่ไม่ใช่ความน่าจะเป็นหรือแหล่งข้อมูลขนาดใหญ่ที่ไม่ใช่ข้อมูลเชิงปริมาณ (สมมติว่ากลับไปที่บทที่ 2) แล้วมีเหตุผลที่น่าเชื่อถือที่จะเชื่อได้ว่าค่าประมาณที่ใช้ในการแบ่งชั้นหลังและ เทคนิคที่เกี่ยวข้องจะดีกว่าที่ไม่ได้ปรับประมาณการดิบ