3.4 कसले सोध्न

यो अनुवाद एक कम्प्यूटर द्वारा सिर्जना गरिएको थियो। ×

3.4 कसले सोध्न

डिजिटल युग सम्भावना नमूना बनाउने अभ्यासमा कठिन छ र गैर सम्भावना नमूनाको लागि नयाँ अवसर सिर्जना गर्दैछ।

नमूनाको इतिहासमा, दुई प्रतिस्पर्धात्मक दृष्टिकोणहरू छन्: सम्भावना नमूने विधिहरू र गैर-सम्भावना नमूना गर्ने तरिकाहरू। यद्यपि दुवै दृष्टिकोण नमूनाको शुरुवात दिनमा प्रयोग गरिएको थियो, सम्भावना नमूना हावी भएको छ, र धेरै सोशल शोधकर्ताहरुले धेरै संदेह संग गैर सम्भावना नमूना हेर्न सिकाइन्छ। यद्यपि, म तल वर्णन गर्दछु, डिजिटल युगद्वारा सिर्जना गरिएका परिवर्तनहरू यसको अर्थ हो कि यो समयका लागि शोधकर्ताहरूको लागि गैर-सम्भावना नमूना पुन: नबनाउने हो। विशेष गरी, सम्भावना नमूना अभ्यासमा गर्न गाह्रो भएको छ, र गैर-सम्भावना नमूना छिटो, सस्तो र राम्रो हुँदैछ। तीव्र र सस्ता सर्वेक्षणहरू आफैमा मात्र समाप्त हुँदैनन्: उनीहरूले प्रायः सर्वेक्षणहरू र ठूला नमूना आकारहरू जस्ता नयाँ अवसरहरू सक्षम गर्छन्। उदाहरणका लागि, गैर सम्भावनात्मक तरिकाहरू प्रयोग गरेर सहकारी सङ्घर्षीय निर्वाचन अध्ययन (सीसीईएस) सम्भावना नमूना प्रयोग गरेर अघिल्लो अध्ययनहरूको तुलनामा लगभग 10 पटक बढी सहभागीहरू सक्षम हुन सक्दछ। यो धेरै ठूलो नमूनाले राजनीतिक शोधकर्ताहरूलाई उपसमूह र सामाजिक सम्बन्धहरूमा व्यवहार र व्यवहारमा भिन्नता अध्ययन गर्न सक्षम बनाउँछ। यसबाहेक, यो थप मात्रा मापको अनुमानमा कमी आएको थिएन (Ansolabehere and Rivers 2013) ।

हाल, सामाजिक अनुसन्धानको लागि नमूना गर्न प्रभावकारी दृष्टिकोण सम्भावना नमूना छ । सम्भावना नमूनामा, लक्षित आबादीका सबै सदस्यहरू नमूना हुनुको ज्ञात, nonzero सम्भावना छ, र सबै मानिसहरू जो सर्वेक्षणमा प्रतिक्रिया दिन्छन्। जब यी सर्तहरू भेटिएमा, सुरुचिपूर्ण गणितीय परिणामहरूले शोधकर्ताको क्षमता लक्षित आबादीको बारेमा इन्स्टिशन बनाउन नमूना प्रयोग गर्ने क्षमताको बारेमा प्रमाणित ग्यारेन्टी प्रदान गर्दछ।

तथापि, यी गणितीय परिणामहरू अन्तर्गत परिस्थितिहरू दुर्लभ रूपमा भेटिए। उदाहरणको लागि, प्राय: कवरेज त्रुटिहरू र गैरप्रणालीहरू छन्। यी समस्याहरूको कारण, शोधकर्ताहरूलाई प्रायः सांख्यिकीय समायोजनहरू प्रयोग गर्नका लागि उनीहरूको नमूना तिनीहरूको लक्षित आबादीमा छनोट गर्न। यसैले, यो महत्त्वपूर्ण नमूना को बीच सिद्धांत को बीच अंतर गर्न महत्वपूर्ण छ, जो सिद्ध सैद्धांतिक ग्यारेन्टी छ, र संभावना मा संभावना नमूना , जो कुनै यस्तो गारंटी प्रदान गर्दछ र विभिन्न सांख्यिकीय समायोजन मा निर्भर गर्दछ।

समयको साथ, सिद्धान्तमा सम्भावना नमूना र अभ्यासमा सम्भावना नमूना बीचको भिन्नता बढेको छ। उदाहरणका लागि, गैर-प्रवृति दरहरू लगातार बढ्दै जान्छन्, उच्च-गुणस्तर, महंगी सर्वेक्षणमा पनि (चित्र 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) । गैर-ट्राफिक दरहरू वाणिज्यिक टेलिफोन सर्वेक्षणहरूमा धेरै अधिक छन्-कहिलेकाहीँ पनि 9 0% उच्च (Kohut et al. 2012) । Nonresponse मा यी बढि अनुमान को गुणवत्ता को खतरा छ किनकी अनुमानहरु मा सांख्यिकीय मोडेल मा तेजी देखि निर्भर छ कि शोधकर्ताहरु nonresponse को लागि समायोजन को उपयोग गर्दछ। यसबाहेक, यो गुणस्तर घट्दै गएको छ सर्वेक्षण अनुसन्धानकर्ताहरूले अत्यधिक प्रतिक्रिया दर कोयम राख्न को लागी धेरै महान् महसुस गरे तापनि भयो। केही मानिसहरू डरलाग्दो छ कि गुणवत्ता र बढ्दो लागतको कमीका यी जुम्लाको प्रवृति सर्वेक्षण अनुसन्धान (National Research Council 2013) को आधारमा धम्की दिन्छन्।

चित्रा 3.5: गैर-प्रवृत्ति बढ्दै गएको छ, उच्च-गुणस्तर महंगी सर्वेक्षणमा पनि (राष्ट्रिय अनुसन्धान परिषद 2013; बी डी मेयर्स, मोक र सुलिवान 2015)। व्यापारिक टेलिभिजन सर्वेक्षणका लागि गैर-प्रत्याशित दरहरू कहिलेकाहीं 9 0% उच्च (कोहोट एट अल। 2012)। Nonresponse मा यी दीर्घकालिक प्रवृत्तिहरूले डेटा संग्रह अधिक महंगा छ र अनुमानहरू कम विश्वसनीय छन्। बी। डी। मायर, मोक, र सुलिवान (2015) बाट अनुकूलित, चित्र 1।

चित्रा 3.5: गैर-प्रवृत्ति बढ्दै गएको छ, उच्च-गुणस्तर महंगी सर्वेक्षणमा पनि (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) । व्यापारिक टेलिभिजन सर्वेक्षणका लागि गैर-प्रत्याशित दरहरू कहिलेकाहीं 9 0% उच्च (Kohut et al. 2012) । Nonresponse मा यी दीर्घकालिक प्रवृत्तिहरूले डेटा संग्रह अधिक महंगा छ र अनुमानहरू कम विश्वसनीय छन्। BD Meyer, Mok, and Sullivan (2015) बाट अनुकूलित, चित्र 1।

एकै समयमा सम्भावना नमूने विधिहरूको लागि बढ्दो कठिनाइहरू भएको छ, त्यहाँ गैर-सम्भावना नमूना पद्धतिहरूमा पनि रोमाञ्चक घटनाहरू छन्। त्यहाँ गैर सम्भावना नमूना विधिहरु को एक किस्म हो, तर एक साधारण चीज जसको छ कि उनि सामान्य मा छ कि उनि सजिलै संग मासिक गणितीय ढांचे को संभावना नमूनांकन (Baker et al. 2013) फिट नहीं गर्न सक्छन्। अन्य शब्दहरुमा, गैर सम्भावना नमूनात्मक तरिकाहरु मा सबै को समावेश को एक ज्ञात र nonzero सम्भावना छैन। गैर-सम्भावना नमूने विधिहरू सामाजिक शोधकर्ताहरूको बीचमा भयानक प्रतिष्ठा छ र तिनीहरू सर्वेक्षण शोधकर्ताहरूको केही सबैभन्दा नाटकीय असफलताहरूसँग सम्बन्धित छन्, जस्तै कि साहित्यिक डाइजेस्ट असफलता (पहिले चर्चा गरिएको) र "डेवी डिटेट्स ट्युमन", अमेरिकाको बारेमा गलत भविष्यवाणी 1 9 48 को राष्ट्रपतिको चुनाव (3.6 अंक)।

चितवन 3.6: राष्ट्रपति हैरी ट्रमनले एक अखबारको शीर्षकलाई पक्रेका थिए जसले गलत रूपमा आफ्नो हार घोषणा गरेका थिए। यो शीर्षक गैर सम्भाव्यता नमूने (अनुमानित 1 9 4 9; बीयन 1 9 50; फ्रिडिमेन, पानिस, र पर्व 2007) को अनुमानमा आधारित थियो। यद्यपि 1 9 48 मा Dewey Defeats ट्रुमेन भयो, यो अझै पनि कारण हो कि केहि शोधकर्ताहरू गैर सम्भावनात्मक नमूनाहरूको अनुमानको बारे मा शंकास्पद छन्। स्रोत: हैरी एस ट्रमन लाइब्रेरी र संग्रहालय।

चितवन 3.6: राष्ट्रपति हैरी ट्रमनले एक अखबारको शीर्षकलाई पक्रेका थिए जसले गलत रूपमा आफ्नो हार घोषणा गरेका थिए। यो शीर्षक गैर सम्भाव्यता नमूने (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) अनुमानित 1 (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) अनुमानमा आधारित थियो। यद्यपि "Dewey Defeats Truman" 1 9 48 मा भयो, यो अझै पनि कारण हो कि केहि शोधकर्ताहरु गैर सम्भावनात्मक नमूनाहरु को अनुमान को बारे मा शंकास्पद छन्। स्रोत: हैरी एस ट्रमन लाइब्रेरी र संग्रहालय ।

एक गैर सम्भाव्यता नमूना को एक रूप जुन डिजिटल युगमा उपयुक्त छ अनलाइन अनलाइन प्यानलहरूको प्रयोग हो। अनलाइन प्यानलहरू प्रयोग गरेर शोधकर्ताहरू प्रायः एक कम्पनी, सरकार वा विश्वविद्यालयमा केही प्यानल प्रदायकमा निर्भर हुन्छन् - जसले ठूलो, विविध समूहहरूको निर्माण गर्ने सर्वेक्षणका लागि उत्तरदाताहरूको रूपमा सेवा गर्न सहमत गर्दछ। यी प्यानल सहभागीहरू अक्सर प्राय: विज्ञापन हुक तरिकाहरू जस्तै अनलाइन ब्यानर विज्ञापनहरू प्रयोग गरेर भर्ती गरिन्छ। त्यसपछि, एक शोधकर्ताले प्यानल प्रदायकलाई वांछित गुणहरूको साथमा नमूनाका नमूनाहरूमा पहुँचको लागि प्यानल प्रदायक भुक्तान गर्न सक्दछ (जस्तै, वयस्कों को राष्ट्रिय प्रतिनिधि)। यी अनलाइन प्यानलहरू गैर-सम्भावना पद्धतिहरू छन् किनभने सबैसँग कुनै पनि ज्ञात, समावेश को nonzero सम्भावना छैन। यद्यपि गैर-सम्भावित अनलाइन प्यानलहरू पहिले नै सामाजिक शोधकर्ताहरू (जस्तै, CCES) द्वारा प्रयोग गरिँदै छन्, त्यहाँ अझै पनि उनीहरूको आकस्मिक अनुमानहरूको गुणस्तरको बारेमा केही बहस छ (Callegaro et al. 2014) ।

यी बहसहरूको बावजुद, मलाई लाग्छ कि सामाजिक अनुसन्धानकर्ताहरूको लागि गैर-सम्भाव्यता नमूना पुन: पश्चात्ताप गर्ने समय भनेको दुई कारण हो। पहिलो, डिजिटल युगमा, गैर सम्भावना नमूने को संग्रह र विश्लेषण मा धेरै विकास भएको छ। यी नयाँ विधिहरू विध्वंसहरूबाट पर्याप्त छन् जुन अतीतमा समस्याहरू हुनसक्छन् जसले मलाई सोच्न सक्छ कि उनीहरूलाई "गैर सम्भावना नमूना 2.0" भनेर सोच्न सक्तैन। "दोस्रो कारणले गर्दा शोधकर्ताहरू गैर-सम्भाव्यता नमूनालाई पुनःसम्पर्क गर्नु पर्छ किनभने सम्भावना नमूना अभ्यास बढ्दै जान्छ। जब त्यहाँ गैर-प्रतिक्रियाको उच्च दरहरू छन् भने त्यहाँ वास्तविक सर्वेक्षणमा छन् - उत्तरदायीहरूको समावेश समावेश हुने वास्तविक सम्भावनाहरू थाहा छैन, र यसैले सम्भाव्यता नमूने र गैर-सम्भाव्यता नमूने फरक फरक छैन जस्तो कि धेरै शोधकर्ताहरूले विश्वास गर्छन्।

मैले पहिले भने, सर्वेक्षण अनुसन्धानको प्रारम्भिक दिनमा केहि भन्दा कम शर्मिला असफलतामा केहि भूमिकाको रुपमा भागमा धेरै सामाजिक शोधकर्ताहरूले गर्दा धेरै सम्भावनाको साथ गैर सम्भावनात्मक नमूनाहरू देखिएका छन्। हामी गैर-सम्भावनात्मक नमूनाहरूसँग कसरी स्पष्ट उदाहरणको स्पष्ट उदाहरण वेई वांग, डेभिड रोथोस्लिल्ड, शारद गोल र एन्ड्रयू जेलम (2015) ले अनुसन्धान गरेको छ जुन 2012 को संयुक्त राष्ट्रसंघको 2012 को निर्वाचनको नराम्रो सम्भावनाको नमूना प्रयोग गरी सफलतापूर्वक बरामद गरिएको छ। अमेरिकन Xbox प्रयोगकर्ताहरु - अमेरिकियों को एक निश्चित रूपरेखा नामांकन नमूना। शोधकर्ताहरूले एक्सबीक्स गेमिङ प्रणालीबाट भर्खरका उत्तरदायीहरू भर्ना गरे र तपाईले आशा गर्न सक्नु भएकोमा, Xbox नमूना पुरुष र स्केन्डेड जवानलाई लुकाएको छ: 18- 2 9 बर्षे महिलाहरु को मतदानको 1 9% र बक्स नमूना 65% र पुरुष मतदानको 47% मत बनाउनुहोस् तर बक्सको 9 3% नमूना (चित्र 3.7)। यी बलियो जनसांख्यिकीय पूर्वाधारहरूको कारण, कच्चा Xbox डेटा चुनाव फिर्तीहरूको खराब संकेतक थियो। यसले बराक ओबामामाथि मिट रोमनको लागि बलियो विजय हासिल गर्यो। फेरि, यो कच्चा, अनियोजित गैर सम्भावना नमूने खतराहरूको अर्को उदाहरण हो र साहित्य डाइजेस्ट अव्यवस्थाको सम्झना हो।

चितवन 3.7: डब्लु. वांग एट अलमा उत्तरदायीहरूको जनसांख्यिकी। (2015)। किनभने प्रतिक्रियाकारहरू Xbox बाट भर्खरै भर्ती भएका थिए, तिनीहरू 2012 का चुनावमा मतदाताहरूको सम्बन्धमा जवान र अधिक सम्भावना नरहेको सम्भव थियो। W. वांग et al बाट अनुकूलित। (2015), आंकडा 1।

चितवन 3.7: W. Wang et al. (2015) उत्तरदायीहरूको जनसांख्यिकी W. Wang et al. (2015) । किनभने प्रतिक्रियाकारहरू Xbox बाट भर्खरै भर्ती भएका थिए, तिनीहरू 2012 का चुनावमा मतदाताहरूको सम्बन्धमा जवान र अधिक सम्भावना नरहेको सम्भव थियो। W. Wang et al. (2015) बाट अनुकूलित W. Wang et al. (2015) , आंकडा 1।

तथापि, वांग र सहकर्मीले यी समस्याहरूको बारेमा जानकारी दिएका थिए र अनुमान गर्दा उनीहरूको गैर-यादृच्छिक नमूना प्रक्रिया समायोजन गर्न प्रयास गरे। विशेष गरी, तिनीहरूले पोष्ट-स्तरीकरणको प्रयोग गर्थे, एक प्रविधिको पनि कभरेज त्रुटि र गैर-प्रतिक्रिया छ कि सम्भावना नमूने समायोजन गर्न व्यापक रूपमा प्रयोग गरिन्छ।

पोस्ट-स्टिटेशनको मुख्य विचार लक्ष्य जनसंख्याको बारेमा सहायक जानकारी प्रयोग गर्न को लागी नमूना सुधार गर्न मद्दत गर्नको लागि हो। उनीहरूको गैर-सम्भावना नमूनाबाट अनुमान गर्न पोस्ट-स्तरीकरणको प्रयोग गर्दा, वाङ र सहयोगीले जनसंख्यालाई विभिन्न समूहमा कटायो, प्रत्येक समूहमा ओबामाको समर्थनको अनुमान लगाईयो, र त्यसपछि समग्र अनुमानको उत्पादन गर्न समूह अनुमानहरूको एक औसत औसत लिनुभयो। उदाहरणका लागि, उनीहरूले जनसंख्यालाई दुई समूह (पुरुष र महिला) मा विभाजन गर्न सक्थे, पुरुष र महिलाबीच ओबामाको समर्थनको अनुमान लगाईयो, र त्यसो गरे कि महिलाहरु लाई बनाउनुका साथै वजन बढाएर ओबामाका लागि समग्र समर्थनको अनुमान मतदाताहरूको 53% र पुरुष 47%। प्रायः, पोस्ट-स्तरीकरणले असम्बलित नमूनाको लागि सही मद्दत गर्दछ जुन सहायक जानकारीमा समूहहरूको आकारको बारेमा ल्याउन सकिन्छ।

पोस्ट-स्ट्याटेशनको कुञ्जी सही समूह बनाउनका लागि हो। यदि तपाईं आबादीलाई सम्वन्धित समूहहरूमा छाड्न सक्नुहुनेछ जुन प्रतिक्रिया क्षमता प्रत्येक समूहको सबैको लागि एउटै हो, त्यसपछि पोस्ट-स्तरीयले निष्पक्ष अनुमानहरू उत्पन्न गर्नेछ। अर्को शब्दमा, लिङ्ग द्वारा पोस्ट-स्ट्राइटिङले अनियमित अनुमानहरू उत्पन्न गर्नेछ यदि सबै पुरुषहरू प्रतिक्रिया प्रबल हुन्छन् र सबै महिलाहरूसँग एउटै प्रतिक्रिया प्रबल हुन्छ। यो धारणा समीकरण-प्रतिक्रिया-क्षमता-भित्र-समूह धारणा भनिन्छ, र मैले यो अध्यायको अन्त्यमा गणितत्मक नोटहरूमा अझ बढी वर्णन गर्दछु।

निस्सन्देह, यो सम्भव छैन कि प्रतिक्रिया क्षमता सबै पुरुष र सबै महिलाहरुको लागि हुनेछ। तथापि, समूहको वृद्धिको संख्याको रूपमा बहुमुखी प्रतिक्रिया-क्षमता-भित्र-समूह धारणा अधिक उपयुक्त हुन्छ। प्रायः, यदि तपाईले अधिक समूहहरू बनाउनुहुन्छ भने आबादीलाई समूहमा आन्तरिक समूहमा सजिलो हुन्छ। उदाहरणका लागि, यो असुविधाजनक लाग्न सक्छ कि सबै महिलाहरुसँग त्यहि प्रतिक्रियाको प्रबद्र्धन हुन्छ, तर यो अधिक सम्भव लाग्न सक्छ कि सबै महिलाहरुको लागि एक समान प्रतिक्रिया हो जो 18-29 बर्षको उमेरमा छ जसले कलेज बाट स्नातक गरेको छ र जो क्यालिफोर्नियामा बस्ने छन् । यसकारण, पोस्ट-स्तरीयेशनमा प्रयोग गरिएका समूहहरूको संख्या ठूलो हुन्छ, त्यसोभए पद्धतिलाई समर्थन गर्न आवश्यक धारणाहरू अधिक व्यावहारिक हुन्छन्। यस तथ्यलाई दिइएको छ, शोधकर्ताहरु अक्सर पोस्ट-स्तरीकरण को लागि धेरै ठूलो समूह बनाउन चाहन्छन। यद्यपि, समूह बढेको संख्याको रूपमा, शोधकर्ताहरूले फरक फरक समस्याको सामना गर्छन्: डेटा स्पेसिटी। यदि प्रत्येक समूहमा केवल एक सानो संख्या हो भने, त्यसपछि अनुमानहरू अधिक अनिश्चित हुनेछ, र चरम अवस्थामा जहाँ त्यहाँ एक समूह हो जुन कुनै उत्तरदाताहरू छैनन्, पछि पोस्ट-स्ट्राइटिफिकेशन पूर्ण रूपमा बिच्छेद गर्दछ।

त्यहाँ दुईवटा तरिकाहरू छन् जसमा सम्वन्धित प्रतिक्रिया-प्रतिक्रिया-प्रवर्धन-भित्र-समूह धारणा र प्रत्येक समूहमा उचित नमूना आकारको मागको सम्भावना बीचको तनाव। पहिलो, शोधकर्ताहरू ठूलो, विविध विविध नमूना एकत्र गर्न सक्छन्, जसले प्रत्येक समूहमा उचित नमूना आकार सुनिश्चित गर्न मद्दत गर्दछ। दोस्रो, तिनीहरू समूह भित्र अनुमान गर्न को लागी एक अधिक परिष्कृत सांख्यिकीय मोडेल प्रयोग गर्न सक्छन्। र, वास्तवमा, कहिलेकाँही शोधकर्ताहरूले दुवै काम गर्छन्, जस्तै वाङ्ग र साथीहरूले Xbox बाट उत्तरदायीहरूको प्रयोग गरी छनोटको अध्ययन गरे।

किनभने तिनीहरू कम्प्युटर-प्रशासित साक्षात्कारका साथ गैर-सम्भावनात्मक नमूना पद्धति प्रयोग गर्दै थिए (म सेक्शन 3.5 मा कम्प्यूटर-प्रशासित साक्षात्कारको बारेमा अधिक कुरा गर्नेछु), वाङ्ग र सहकर्मीहरूको सस्तो सङ्कलन डेटा संग्रह थियो, जसले तिनीहरूलाई 345,858 अद्वितीय सहभागीहरूबाट जानकारी सङ्कलन गर्न सक्षम बनायो। , मतदानको मापदण्डद्वारा एक ठूलो संख्या। यो विशाल नमूना साइजले उनलाई धेरै पोस्टस्टेडेशन समूहहरू बनाउनको लागि सक्षम बनायो। तर पोष्ट-स्तरीकरण सामान्यतया जनसंख्या सयौं समूहहरूमा छान्ने गर्दछ, वाङ्ग र सहकर्मीहरूले जनसंख्यालाई लिङ्ग (2 कोटीहरू), रेस (4 कोटिहरू), उमेर (4 श्रेणीहरू), उमेर (4 वर्गहरू), शिक्षा (4 कोटिहरू) द्वारा परिभाषित 176,256 समूहहरूमा विभाजन गरेको छ। (51 कोटिहरू), पार्टी आइडी (3 कोटीहरू), विचारधारा (3 कोटीहरू), र 2008 मत (3 कोटिहरू)। अन्य शब्दहरूमा, उनीहरूको विशाल नमूना आकार, जुन कम-लागत डेटा संग्रह द्वारा सक्षम गरिएको थियो, उनीहरूलाई उनीहरूको अनुमानको प्रक्रियामा अधिक सम्भावनात्मक धारणा बनाउन सक्षम भयो।

यहां सम्म कि 345,858 अद्वितीय सहभागिता संग, तथापि, अझै पनि धेरै थिए, धेरै समूहहरु को लागि वांग र सहयोगिहरु को लगभग कुनै उत्तरदाताओं थिएन। त्यसोभए, उनीहरूले प्रत्येक समूहमा समर्थन अनुमान गर्न बहुविध रिग्रेस भनिने एक प्रविधिको प्रयोग गरे। अनिवार्य रूपमा, एक विशेष समूह भित्र ओबामाको समर्थनको अनुमान गर्न बहुभाषी रिफिशनले धेरै नजिकका सम्बन्धी समुहहरु बाट जानकारी पत्ता लगायो। उदाहरणका लागि, 18 र 2 बर्षको उमेर बीच ओबामाका लागि समर्थनको अनुमान लगाउन कल्पना गर्ने प्रयास गर्नुहोस् जुन कलेज स्नातकहरू छन्, जो डेमोक्रेट दर्ता गरिएका छन्, जसले मध्यस्थताको रूपमा आत्म-पहिचान गर्छ, र जसले 2008 मा ओबामालाई मतदान गरे। यो एक धेरै , धेरै विशिष्ट समूह, र यो सम्भव छ कि यिनी विशेषताहरु संग नमूना मा कुनै पनि छैन। यसैले, यस समूहको बारेमा अनुमान गर्न बहुभाषी रिजर्भेसनले सांख्यिकीय मोडेल प्रयोग गर्दछ जुन धेरै समूहमा व्यक्तिहरूको अनुमान सँगै सँगै पूल जान्छ।

यसैले, वाङ्ग र साथीहरूले एक दृष्टिकोण प्रयोग गरे जुन संयुक्त बहुविध रिफ्रेस र पोष्ट-स्तरीय संयन्त्र प्रयोग गरे, त्यसैले उनीहरूले पछिल्ला स्टोटेशनको साथ बहुविध रिभ्प्रेशन भनिन्, वा अधिक सम्भावनासाथ, "श्रीमान् पी। "एक्सबाक र सहकर्मीहरूले XBox गैर-सम्भावना नमूनाबाट अनुमान गर्नका लागि श्री पी। प्रयोग गर्दा, उनीहरूले 2012 को चुनावमा (ओभर 3.8 3.8) प्राप्त गरेका सम्पूर्ण समर्थनको अनुमान गरेका थिए। वास्तवमा तिनीहरूका अनुमानहरू सार्वजनिक पारदर्शी जनसङ्ख्याको समग्रताको तुलनामा अधिक सही थियो। यस प्रकार, यस मामला मा, सांख्यिकीय समायोजन-विशेष रूप देखि श्री पी। - गैर संभावना संभावना डेटा मा पूर्वाग्रह को ठीक राम्रो काम गर्न लाग््छ; पूर्वाधारहरू जुन स्पष्ट रूपमा दृश्यात्मक देखिन्छ जब तपाई अनियोजित Xbox डाटाको अनुमानमा हेर्नुहुन्छ।

चितवन 3.8: अनुमानित डब्ल्यू वांग एट अल। (2015)। अनियोजित XBox नमूनाले गलत अनुमानहरूको उत्पादन गर्यो। तर, भारित एक्सबक्स नमूनाले अनुमान लगाएको अनुमान लगायतका औसत अनुमानहरूको आधारभूत डेटा सर्भर भन्दा अधिक सटीक थियो। W. वांग et al बाट अनुकूलित। (2015), तथ्याङ्क 2 र 3।

चितवन 3.8: अनुमानित W. Wang et al. (2015) । अनियोजित XBox नमूनाले गलत अनुमानहरूको उत्पादन गर्यो। तर, भारित एक्सबक्स नमूनाले अनुमान लगाएको अनुमान लगायतका औसत अनुमानहरूको आधारभूत डेटा सर्भर भन्दा अधिक सटीक थियो। W. Wang et al. (2015) बाट अनुकूलित W. Wang et al. (2015) , तथ्याङ्क 2 र 3।

वाङ र सहकर्मीको अध्ययनबाट दुई मुख्य पाठहरू छन्। पहिलो, असामान्य गैर सम्भावना नमूनाहरू खराब अनुमानहरूको कारण हुन सक्छ; यो एक पाठ हो कि धेरै शोधकर्ताहरूले पहिले सुनेका छन्। तथापि, दोस्रो, यो सम्भव छ कि गैर-सम्भाव्यता नमूनाहरू ठीकसँग विश्लेषण गर्दा, वास्तवमा राम्रो अनुमानहरू उत्पादन गर्न सक्दछ; गैर-सम्भाव्यता नमूनाहरू स्वचालित रूपमा साहित्यिक डाइजेस्ट असफलता जस्तै केहि गर्न सकिदैन।

अगाडि जाँदै, यदि तपाइँ सम्भावना नमूना दृष्टिकोण र एक गैर-सम्भावना नमूना गर्ने दृष्टिकोण प्रयोग गरी निर्णय गर्न प्रयास गर्दै हुनुहुन्छ भने तपाइँ एक कठिन छनौट सामना गर्नुहुन्छ। कहिलेकाँही शोधकर्ताहरू एक द्रुत र कठोर नियम चाहन्छन् (उदाहरणार्थ, सम्भवतः सम्भावना नमूना गर्ने तरिकाहरू प्रयोग गर्नुहोस्), तर यो एक नियमलाई प्रस्ताव गर्न गाह्रो छ। सम्भावना नमूना गर्ने विधिहरू बीच अभ्यासमा एक कठिन छनौट सामना गर्दछन् - जो बढि महँगो हुन्छ र सैद्धांतिक नतिजाहरु भन्दा टाढा छन् जुन उनीहरुको उपयोग को औचित्य र गैर-सम्भावना नमूना गर्ने विधिहरु लाई सजिलो हुन्छ - जुन सस्ता र छिटो हुन्छ तर कम परिचित र अधिक फरक। एक कुरा स्पष्ट छ, तथापि, यदि तपाईं गैर सम्भावनात्मक नमूना वा अपरिवर्तनीय ठूलो डेटा स्रोतहरू (अध्याय 2 मा फिर्ता सोच्नुहोस्) सँग काम गर्न बाध्य हुन्छ भने, त्यसपछि पोस्ट-स्तरीकरण र प्रयोग गरी गरेको अनुमानमा विश्वास गर्ने एक बलियो कारण हो। सम्बन्धित प्रविधिहरू असामान्य, कच्चा अनुमान भन्दा राम्रो हुनेछ।