3.4.2 नॉन-संभाव्यता नमुने: भार योजन

हे भाषांतर संगणक तयार केले होते. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 नॉन-संभाव्यता नमुने: भार योजन

नॉन-संभाव्यता नमुने, वजन आहे असे गृहीत धरले नमूना प्रक्रिया झाल्याने माहित पूर्ववत करू शकता.

संशोधक शक्यता नमुने प्रतिसादांची वजन त्याच प्रकारे, ते देखील नॉन-संभाव्यता नमुने प्रतिसादांची वजन करू शकता. उदाहरणार्थ, CPS पर्याय म्हणून, आपण बेकारी दर अंदाज एक सर्वेक्षण सहभागी भरती हजारो वेबसाइट वर बॅनर जाहिरात स्थित अशी कल्पना करा. साहजिकच, आपण आपल्या नमुना सोपे क्षुद्र बेकारी दर एक चांगला अंदाज असेल की संशयवादी होईल. कारण आपण काही लोक इतरांपेक्षा आपल्या सर्वेक्षण पूर्ण होण्याची अधिक शक्यता असते असे वाटते की, आपल्या शंकांना बहुदा आहे. उदाहरणार्थ, कोण वेबवर खूप वेळ खर्च नाही लोक आपल्या सर्वेक्षण पूर्ण होण्याची शक्यता कमी आहे.

आम्ही गेल्या विभागात पाहिले, तथापि, नमुना निवड-कसे आपल्याला माहीत आहे तर होते आम्ही संभाव्यता करू नमुने-नंतर आम्ही नमूना प्रक्रिया झाल्याने माहित पूर्ववत करू शकता. दुर्दैवाने, नॉन-संभाव्यता नमुने काम करताना, आम्ही नमुना कसे निवड झाली माहीत नाही. पण, आम्ही नमूना प्रक्रिया पायरी करू शकता आणि नंतर तशाच प्रकारे भार योजन लागू. या पायरी योग्य असल्यास, नंतर भार योजन नमूना प्रक्रिया झाल्याने माहित पूर्ववत करेल.

उदाहरणार्थ, आपल्या बॅनर जाहिराती प्रतिसाद, आपण 100,000, सर्वेक्षणात भरती अशी कल्पना करा. तरी, आपण या 100,000 सर्वेक्षणात अमेरिकन प्रौढ एक साधी यादृच्छिक नमुना आहे, असे मत नाही. खरं तर, आपण अमेरिकन लोकसंख्या आपल्या सर्वेक्षणात तुलना करता, तेव्हा आपण काही राज्यांमध्ये (उदा, न्यू यॉर्क) पासून लोकांवर-प्रतिनिधित्व आणि काही राज्ये (उदा, अलास्का) लोक आहोत अंतर्गत प्रतिनिधित्व असतात. त्यामुळे, आपल्या नमुना बेकारी दर एक वाईट लक्ष्य लोकसंख्या बेरोजगारीचे प्रमाण च्या अंदाज पडण्याची शक्यता आहे.

नमूना प्रक्रियेत घडले होते, असे कुरूपता पूर्ववत करण्याचा एक मार्ग प्रत्येक व्यक्ती करण्यासाठी, वजन लागू आहे; राज्यातील लोक कमी वजन नमुना (उदा, अलास्का) अंतर्गत-प्रस्तुत केले जातात हे राज्य नमुना (उदा, न्यू यॉर्क) आणि उच्च वजन लोकांना प्रती-प्रतिनिधित्व आहे. अधिक विशेषतः, प्रत्येक प्रतिवादी वजन अमेरिकन लोकसंख्येच्या त्यांच्या प्रभाव नमुना नातेवाईक त्यांच्या प्रभाव संबंधित आहे. या भार योजन प्रक्रिया पोस्ट-साहित्य बियाणे म्हणतात, आणि वजनाचा कल्पना र्होड आयलंड पासून सर्वेक्षणात कॅलिफोर्निया पासून सर्वेक्षणात पेक्षा कमी वजन दिले होते जेथे विभाग 3.4.1 मध्ये उदाहरणार्थ आपण स्मरण पाहिजे. पोस्ट-साहित्य बियाणे आपण गट आपल्या सर्वेक्षणात ठेवणे आणि प्रत्येक गटाचे लक्ष्य लोकसंख्या प्रमाण जाणून पुरेशी माहिती असणे आवश्यक आहे.

संभाव्यता नमुना आणि नॉन-संभाव्यता नमुना भार योजन त्याच अचूकपणे (तांत्रिक परिशिष्ट पहा) आहेत, तरी ते विविध घटनांमध्ये चांगले काम. संशोधक एक परिपूर्ण शक्यता नमुना (म्हणजेच, å या त्रुटी आणि-नसलेले प्रतिसाद) आहे, तर भार योजन सर्व प्रकरणांमध्ये सर्व अद्वितीय वैशिष्ट्य साठी निःपक्षपाती अंदाज निर्मिती होईल. शक्यता नमुने वकिल त्यांना आकर्षक शोधू का या मजबूत सैद्धांतिक हमी आहे. दुसरीकडे, भार योजन नॉन-संभाव्यता नमुने फक्त सर्व अद्वितीय वैशिष्ट्य साठी निःपक्षपाती अंदाज प्रतिसाद propensities प्रत्येक समूहातील प्रत्येकासाठी सारखीच असतात तर निर्मिती होईल. दुसऱ्या शब्दांत, पोस्ट-साहित्य बियाणे वापरून न्यू यॉर्क मध्ये प्रत्येकजण सहभागी आणि अलास्का मध्ये प्रत्येकजण सहभागी आणि वर समान संभाव्यता आहे समान संभाव्यता आहे तर निःपक्षपाती अंदाज निर्मिती, आमच्या उदाहरण परत विचार. या समज एकसंध-प्रतिसाद propensities मध्ये-गट समज म्हणतात, आणि तो पोस्ट साहित्य बियाणे नॉन-संभाव्यता नमुने चांगले कार्य करेल तर जाणून महत्त्वाची भूमिका बजावते.

दुर्दैवाने, आमची उदाहरण, एकसंध-प्रतिसाद propensities मध्ये-गट समज खरे असल्याचे अशक्य दिसते. म्हणजे, तो अलास्का मध्ये प्रत्येकजण आपल्या सर्वेक्षण असल्याने त्याच शक्यता आहे की अशक्य दिसते. पण, जे सर्व अधिक सर्वांत वाटते करण्यासाठी पोस्ट-साहित्य बियाणे बद्दल लक्षात ठेवणे तीन महत्वाचे मुद्दे आहेत.

प्रथम, एकसंध-प्रतिसाद propensities मध्ये-गट मानून गट वाढते संख्या अधिक बदलले असले होते. आणि, संशोधक फक्त एकच भौगोलिक आकारमान आधारित गट मर्यादित नाही. उदाहरणार्थ, आम्ही राज्य, वय, लिंग, आणि शिक्षण स्तरावर आधारित गटांमध्ये तयार करू शकलो. तो 18-29 गट आत एकसंध प्रतिसाद propensities आहे की अधिक बदलले असले दिसते, अलास्का येथे राहणाऱ्या सर्व लोकांना समूहातील पेक्षा अलास्का मध्ये जिवंत महिला, महाविद्यालयीन शिक्षण. अशा प्रकारे, पोस्ट-साहित्य बियाणे वाढते वापरले गट क्रमांक, पायरी अधिक वाजवी झाले समर्थन करणे आवश्यक आहे. हे खरं दिले, तो एक संशोधक पोस्ट-साहित्य बियाणे गट एक प्रचंड संख्या तयार करू इच्छित आहेत असे वाटते. डेटा sparsity: पण, गट वाढते संख्या, संशोधक एक भिन्न समस्या येवू. प्रत्येक समूहातील लोकांना फक्त एक लहान संख्या आहेत तर, नंतर अंदाज अधिक अनिश्चित असेल, आणि अत्यंत बाबतीत जेथे सर्वेक्षणात आहे की एक गट आहे, नंतर पोस्ट-साहित्य बियाणे पूर्णपणे खाली तोडण्यासाठी. homogeneous- प्रतिसाद कल मध्ये-गट समज च्या लाघवीपणा आणि प्रत्येक गटाचे वाजवी नमुना आकार मागणी दरम्यान या मूळचा तणाव बाहेर दोन मार्ग आहेत. एक पद्धत वजन मोजण्यासाठी एक अधिक अत्याधुनिक संख्याशास्त्रीय मॉडेल हलविण्यासाठी आहे आणि इतर मोठ्या, अधिक वैविध्यपूर्ण नमुना आहे, जे प्रत्येक समूहातील वाजवी नमुना आकार सुनिश्चित करते गोळा करण्यासाठी आहे. आणि, कधी कधी संशोधक दोन्ही, मी खाली अधिक तपशील वर्णन कराल म्हणून करू.

नॉन-संभाव्यता नमुन्यांची पोस्ट-साहित्य बियाणे काम करताना एक दुसरा विचार शक्यता नमुने विश्लेषण करताना एकसंध-प्रतिसाद कल मध्ये-गट समज आधीच वारंवार केली आहे. या समज सराव संभाव्यतेची नमुने आवश्यक आहे की कारण संभाव्यता नमुने नॉन-प्रतिसाद आहे की आहे, आणि वर वर्णन नॉन-प्रतिसाद ऍडजस्टमेंट सर्वात सामान्य पध्दत पोस्ट-साहित्य बियाणे आहे. अर्थात, अनेक संशोधक करा फक्त कारण एक विशिष्ट समज आपण खूप करू नये याचा अर्थ असा नाही. पण, तो सराव मध्ये शक्यता नमुने नॉन-संभाव्यता नमुने तुलना करताना, आम्ही दोन्ही अंदाज निर्मिती करण्यासाठी पायरी आणि अधिक माहिती अवलंबून लक्षात ठेवणे आवश्यक आहे याचा अर्थ असा नाही. सर्वात वास्तववादी सेटिंग्ज मध्ये, फक्त तर्क नाही समज मुक्त पध्दत आहे.

शेवटी, आपण एखाद्या अंदाज काळजी तर उदाहरण बेकारी विशिष्ट-इन दर-नंतर आपण एकसंध-प्रतिसाद कल मध्ये-गट समज अनुमानापेक्षा कमकुवत एक अट आवश्यक आहे. विशेषतः, आपण सर्वांनी समान प्रतिसाद कल आहे असे गृहीत करण्याची गरज नाही, आपण फक्त प्रत्येक गटामध्ये प्रतिसाद कल आणि बेकारी दर दरम्यान नाही परस्परसंबंध आहे असे गृहीत धरते करण्याची आवश्यकता आहे. अर्थात, या कमकुवत स्थिती काही परिस्थितीत धारण करणार नाही. उदाहरणार्थ, स्वयंसेवक काम करू अमेरिकन प्रमाण निश्चित कल्पना. कोण स्वयंसेवक काम करू लोक एका सर्वेक्षणात असल्याचे मान्य होण्याची अधिक शक्यता असते तर, नंतर संशोधक होईल पद्धतशीरपणे प्रती-अंदाज, स्वयंसेवकांना रक्कम त्या पोस्टवर-साहित्य बियाणे ऍडजस्ट करून empirically प्रात्यक्षिक केले गेले आहे की यामुळे केला तर Abraham, Helms, and Presser (2009) .

मी आधी सांगितल्याप्रमाणे, नॉन-संभाव्यता नमुने महान आणि शंकांना सामाजिक शास्त्रज्ञ, भाग कारण सर्वेक्षण संशोधन लवकर दिवसांत अत्यंत लाजीरवाणा अपयश काही त्यांच्या भूमिका पाहिले जाते. बिगर संभाव्यता नमुने आलो आहे किती एक स्पष्ट उदाहरण योग्य अमेरिकन Xbox वापरकर्ते एक नॉन-संभाव्यता नमुना वापरून 2012 US निवडणूक परिणाम जप्त की वेई वांग, डेव्हिड Rothschild शरद गोयल आणि अँड्र्यू Gelman संशोधन आहे अर्थात अमेरिकन नि: शंकपणे नॉन-रँडम नमुना (Wang et al. 2015) . संशोधक XBox गेमिंग प्रणाली पासून सर्वेक्षणात भरती, आणि आपण अपेक्षा कदाचित म्हणून, हे Xbox नमुना पुरुष अगदीच विषम आणि तरुण अगदीच विषम: 18 - 29 वर्ष वयोगटातील मुले मतदार 19% पण हे Xbox नमुना 65% पर्यंत करा आणि पुरुष 47% पर्यंत करा मतदार आणि Xbox नमुना (आकृती 3.4) 93% आहे. कारण या मजबूत डेमोग्राफिक चुका च्या कच्च्या हे Xbox डेटा निवडणूक परतावा एक गरीब सूचक होते. हे बराक ओबामा प्रती कधीच होणार महत्वाचा एक मजबूत विजय अंदाज. पुन्हा एकदा, हे कच्चे unadjusted नॉन-संभाव्यता नमुने धोके आणखी एक उदाहरण आहे आणि साहित्य डायजेस्ट फज्जा ची आठवण करून देणारा आहे.

आकृती 3.4: वांग आणि अल सर्वेक्षणानुसार लोकसंख्या. (2015). सर्वेक्षणात Xbox पासून भरती आले होते त्यामुळे त्यांना तरुण आणि पुरुष, 2012 निवडणुकीत मतदार संबंधित असणे होण्याची अधिक शक्यता असू होण्याची अधिक शक्यता होती.

आकृती 3.4: सर्वेक्षणानुसार लोकसंख्या Wang et al. (2015) . सर्वेक्षणात Xbox पासून भरती आले होते त्यामुळे त्यांना तरुण आणि पुरुष, 2012 निवडणुकीत मतदार संबंधित असणे होण्याची अधिक शक्यता असू होण्याची अधिक शक्यता होती.

तथापि, Wang आणि सहकारी या समस्या जाणीव होते आणि नमूना प्रक्रिया दुरुस्त करण्यासाठी सर्वेक्षणात वजन प्रयत्न केला. विशेषतः, त्या पोस्ट-साहित्य बियाणे मी तुम्हांला सांगितले एक अधिक अत्याधुनिक स्वरूपात वापरली. तो त्यांच्या दृष्टिकोन बद्दल थोडी अधिक शिकत तो पोस्ट साहित्य बियाणे बद्दल अंतर्ज्ञान बनवतो कारण आहे, आणि वापरले विशिष्ट आवृत्ती Wang आणि सहकारी भार योजन नॉन-संभाव्यता सॅम्पल सर्वात रोमांचक पध्दती एक आहे.

कलम 3.4.1 मध्ये बेकारी अंदाज आमच्या साधे उदाहरण, आम्ही राहण्याचा राज्य आधारित गटांत लोकसंख्या वाटून. याउलट, Wang आणि सहकारी व्याख्या 176.256 गट मध्ये लोकसंख्या वाटणी लिंग (2 श्रेणी), शर्यत (4 श्रेणी), वय (4 श्रेणी), शिक्षण (4 श्रेणी), राज्य (51 श्रेणी), पक्ष आयडी (3 श्रेणी), विचारधारा (3 श्रेणी) आणि 2008 मत (3 श्रेणी). अधिक गट, संशोधक तो प्रत्येक गटामध्ये, प्रतिसाद कल ओबामा समर्थन uncorrelated होते की वाढत्या शक्यता अशी आशा व्यक्त केली. पुढे, ऐवजी आम्ही आमच्या उदाहरण मध्ये केलं म्हणून, वैयक्तिक स्तरीय वजन रचना पेक्षा, Wang आणि सहकारी एक जटिल मॉडेल ओबामा मतदान होईल की प्रत्येक गट लोक प्रमाणात अंदाज वापरले. शेवटी, ते आधार एक अंदाज एकूण पातळी निर्मिती प्रत्येक गट ओळखले आकार आधार या गट अंदाज एकत्र. दुसऱ्या शब्दांत, ते लोकसंख्या विविध गटांमध्ये, चिरलेली प्रत्येक समूहातील ओबामा समर्थन अंदाज, आणि नंतर एक एकूणच अंदाज निर्मिती गट अंदाज एक सरासरी घेतला.

त्यामुळे वृत्तीचा मोठे आव्हान या 176.256 गट प्रत्येक ओबामा समर्थन अंदाज आहे. त्यांच्या पॅनल 345.858 अद्वितीय सहभागी निवडणूक मतदान मानके यांनी एक प्रचंड संख्या समाविष्ट तरी, अनेक, अनेक गट जे Wang आणि सहकारी जवळजवळ नाही सर्वेक्षणात होते होते. त्यामुळे ते एक तंत्र वापरले प्रत्येक गट पोस्ट-साहित्य बियाणे सह बहुस्तरीय पुन्ह म्हणतात, संशोधक प्रेमाने, श्री पी संचाची अनेक माहिती एक विशिष्ट गट आत ओबामा समर्थन अंदाज मूलत: श्री पी कॉल, जे समर्थन अंदाज लक्षपूर्वक गट संबंधित. उदाहरणार्थ, डेमोक्रॅट नोंदणीकृत आहेत महाविद्यालयीन शिक्षण, नेमस्त, जे कोणी स्वत: ची ओळख कोण आहेत हे 2008 मध्ये ओबामा मतदान दरम्यान जुन्या 18-29 वर्षे महिला Hispanics आपापसांत ओबामा समर्थन अंदाज आव्हान विचार, अतिशय विशिष्ट गट आहे, आणि तो या वैशिष्ट्ये नमुना कोणीच वाली नाही, अशी शक्यता आहे. म्हणून, हे गट बद्दल अंदाज करण्यासाठी, श्री पी संचाची एकत्र खूप समान गट लोक अंदाज आहे.

हे विश्लेषण धोरण वापरून, Wang आणि सहकारी अतिशय लक्षपूर्वक ओबामा 2012 निवडणूक प्राप्त एकूणच समर्थन अंदाज XBox नॉन-संभाव्यता नमुना वापर करण्यास सक्षम होते (आकृती 3.5). खरं तर त्यांच्या अंदाज सार्वजनिक मत निवडणुका एकत्रित अधिक अचूक होते. त्यामुळे या प्रकरणात, भार योजन-विशेषतः श्री चांगली नोकरी नॉन-संभाव्यता डेटा चुका दुरुस्त करू पी-दिसते; आपण unadjusted Xbox डेटा अंदाज पाहू दृश्यमान चुका.

आकृती 3.5: वांग ET अल पासून अंदाज. (2015). Unadjusted XBox नमुना चुकीचा अंदाज निर्मिती केली. पण, वेटेड XBox नमुना शक्यता-आधारित दूरध्वनी सर्वेक्षण च्या सरासरीने अधिक अचूक होते की अंदाज निर्मिती केली.

आकृती 3.5: पासून अंदाज Wang et al. (2015) . Unadjusted XBox नमुना चुकीचा अंदाज निर्मिती केली. पण, वेटेड XBox नमुना शक्यता-आधारित दूरध्वनी सर्वेक्षण च्या सरासरीने अधिक अचूक होते की अंदाज निर्मिती केली.

Wang आणि सहकारी अभ्यास दोन मुख्य धडे आहेत. प्रथम, unadjusted नॉन-संभाव्यता नमुने वाईट अंदाज होऊ शकते या अनेक संशोधक आधी ऐकले आहे की एक धडा आहे. तथापि, दुसरा धडा नॉन-संभाव्यता नमुने योग्य ठरते, तेव्हा प्रत्यक्षात जोरदार चांगला अंदाज उत्पन्न करू शकतो आहे. तर त्यांच्या अंदाज pollster.com, अधिक पारंपारिक निवडणूक निवडणुका एकत्रीकरण पासून अंदाज अधिक अचूक होते.

शेवटी, या एका विशिष्ट अभ्यास शिकू शकतो काय महत्वाचे मर्यादा आहेत. पोस्ट-साहित्य बियाणे या विशिष्ट प्रकरणात चांगले काम केले फक्त कारण, तो इतर प्रकरणांमध्ये चांगले कार्य करेल, याची शाश्वती नाही आहे. खरं तर, निवडणूक कारण pollsters जवळजवळ 100 वर्षे निवडणूक अभ्यास करत आहेत कदाचित सर्वात सोपा सेटिंग्ज आहेत, नियमित अभिप्राय (आम्ही निवडणुकीत विजय कोण पाहू शकते), आणि पक्ष ओळख आहे आणि लोकसंख्या वैशिष्ट्ये मतदान तुलनेने सूचक आहेत. या टप्प्यावर, आम्ही घन सिद्धांत आणि गैर-संभाव्यता सॅम्पल भारांकन ऍडजस्ट सूचविले अचूक अंदाज निर्मिती होईल तेव्हा माहित प्रायोगिक अनुभव अभाव आहे. स्पष्ट आहे की एक गोष्ट, तथापि, आपण नॉन-संभाव्यता नमुने काम करणे भाग आहेत तर आहे, नंतर सुस्थीत अंदाज न सुस्थीत अंदाज चांगले असेल, असा विश्वास मजबूत कारण आहे.