3.4.2 غير ممڪن جو نمونو: weighting

غير ممڪن نموني سان، وزن جو فرض هوندا عمل جي سبب distortions کي ختم ڪري سگهي ٿو.

ساڳيء طرح ته تحقيق ممڪن نموني کان جواب وزن ۾، اهي به غير ممڪن نموني کان جواب وزن ڪري سگهو ٿا. مثال طور، سنڌ جي CPS ڪرڻ لاء هڪ متبادل جي طور تي، تصور آهي ته توهان ويب سائيٽ جي هزارين تي بينر اشتهارن رکيل جي بيروزگاري جي شرح ۾ اندازي ڪرڻ ۾ هڪ سروي لاء ڌرين نياز ڪري. قدرتي طور، توهان ڀريو ته پنهنجي نموني جي سادي معني جي بيروزگاري جي شرح ۾ هڪ سٺي اندازي وڃي ها هجي ها. توهان skepticism شايد ڇاڪاڻ ته اوھان کي خيال آهي ته ڪجھ ماڻهن کي وڌيڪ ٻين کان پنهنجي سروي مڪمل ڪرڻ جو امڪان آهي. مثال طور، جيڪي ماڻهو سنڌ جي ويب تي ان وقت جي تمام گهڻو خرچ نه ڪندا آھن گهٽ توهان جي سروي مڪمل ڪرڻ جو امڪان آهي.

اسان جي آخري حصي ۾ ڏٺو جيئن، تنهن هوندي به، ته اسان کي خبر آهي ته ڪيئن هن نموني ٿيل آهي-جيئن ته ويو اسان ممڪن نموني-پوء کڻي ٿا اسان جي هوندا عمل جي سبب distortions کي ختم ڪري سگهي ٿو. افسوس، جڏهن غير ممڪن نموني سان ڪم ڪري، اسان کي نه ڄاڻندا آھن ڪيئن نموني ٿيل هو. پر، اسان جي هوندا عمل جي باري ۾ assumptions ڪر ۽ وري ساڳئي رستي ۾ weighting لاڳو ڪري سگهو ٿا. انهن assumptions صحيح آهي، ته پوء ان جي weighting جي هوندا عمل جي سبب جي distortions ختم ڪندو.

مثال طور، تصور آهي ته توهان جي بينر اشتهارن جي جواب ۾، تون آبادي 100،000 يعني respondents نوڪر. تنهن هوندي به، توهان کي نه مڃيندا آھن ته انهن آبادي 100،000 يعني respondents آمريڪي بالغ جي هڪ سادي بي ترتيبي ٺهيل آهن. حقيقت ۾، جڏهن توهان آمريڪا جي آبادي کي پنهنجي respondents compare، اوھان کي لھندا ته ڪجهه رياستن (مثال طور، نيو يارڪ) مان ماڻهن کان مٿي-ظاھر ڪئي ۽ ته ڪجهه رياستن (مثال طور، فيبروري) مان ماڻهن کان گهٽ-ظاھر آهن. اهڙيء طرح، پنهنجي نموني جي بيروزگاري جي شرح ۾ ٽارگيٽ آبادي ۾ بيروزگاري جي شرح ۾ هڪ خراب اندازي ٿيڻ جو امڪان آهي.

هڪ واٽ جي تحريف آهي ته هوندا عمل ۾ مشھور کي ختم ڪرڻ لاء هر ماڻهو کي وزن مقرر ڪرڻ آهي. چيو ويو آهي ته هيٺ-ظاھر جو نمونو (مثال طور، فيبروري) ۾ آهي مان قوم کي (مثال طور، نيو يارڪ) چيو ويو آهي ته نموني ۾ مٿان-ظاھر ڪئي پئي وڃي ۽ اعلي وزن کان ماڻهن کي هيٺين وزن. وڌيڪ خاص، هر respondent لاء وزن آمريڪا جي آبادي ۾ سندن گهڻيون کي پنهنجي نموني مائٽ ۾ سندن گهڻيون سان لاڳاپيل آهي. هن weighting طريقيڪار پوسٽ-stratification سڏيو ويندو آهي، ۽ وزني جي خيال سيڪشن 3.4.1 جتي Rhode ٻيٽ کان respondents ڪيليفورنيا مان respondents جي ڀيٽ ۾ گهٽ وزن ڏنو ويو ۾ مثال جي اوھان کي نصيحت ڪرڻ گهرجي. پوسٽ-stratification جي ضرورت اوھان کي ڪافي گروپن ۾ پنهنجي respondents وجهي ۽ هر گروپ ۾ ٽارگيٽ آبادي جو اندازو خبر کي خبر آهي ته.

جيتوڻيڪ ممڪن نموني جي ۽ غير ممڪن نموني جي weighting mathematically به ساڳيو آهي (فني جر کي ڏسي)، اھي مختلف حال ۾ چڱي ڪم. جو محقق هڪ ڀرپور ممڪن نموني (يعني ڪو ڪوريج گمراھي ۽ ڪو به غير جواب) ڪئي آهي ته، پوء weighting سڀ ڪيس ۾ سڀني فصلن لاء بغير ڪنهن ڪاٿي پيدا ڪندو. هي مضبوط نظرياتي ضمانت آهي ڇو ممڪن نموني جي advocates کين پوء پرڪشش لھندين. ٻئي هٿ تي، غير ممڪن نموني weighting رڳو سڀني فصلن لاء بغير ڪنهن ڪاٿي پيدا جيڪڏهن جواب propensities هر گروپ ۾ هر هڪ لاء ساڳيو آهي ڪندو. ٻين لفظن ۾، استعمال ڪري ته نيو يارڪ ۾ حصو وٺڻ جي ساڳي ممڪن ڪئي آهي ۽ فيبروري ۾ حصو وٺڻ ۽ پوء تي جي هڪ ئي ممڪن ڪئي آهي پوسٽ-stratification بغير ڪنهن ڪاٿي پيدا ڪندو واپس اسان جي مثال کي سوچڻ،. هن گمان جي homogeneous-جواب-propensities-اندر-گروپن گمان سڏيو ويندو آهي، ۽ ان کي ڄاڻڻ ۾ هڪ اهم ڪردار ادا ڪري ته پوسٽ-stratification غير ممڪن نموني سان چڱي ڪم ڪندو.

افسوس، اسان جي مثال ۾، جي homogeneous-جواب-propensities-اندر-گروپن گمان سچ ٿي بعيد لڳي. اهو آهي، ته ان کي بعيد لڳي فيبروري ۾ هر ماڻهو پنهنجي سروي ۾ پئي جو هڪ ئي ممڪن آهي. پر، اتي ٽي اهم جون پوائينٽون: پوسٽ-stratification جي باري ۾ ذهن ۾ رکڻ لاء، جنهن جي سڀ کان وڌيڪ افزا ورتاء ڪرڻ آهي.

پهريون، homogeneous-جواب-propensities-اندر-گروپن گمان گروپن وڌائي جي تعداد ۾ جيئن زياده قرين قياس ٿيندو. ۽، تحقيق صرف ھڪ جاگرافيائي طول جي بنياد تي گروهن تائين محدود نه آهي. مثال طور، اسان تي رياست، عمر، جنس، ۽ تعليم جي سطح تي ٻڌل گروپ پيدا ٿي سگهي ٿو. اهو زياده قرين قياس لڳي فيبروري ۾ رهندڙ سڀني ماڻهن جي گروهه جي اندر جي ڀيٽ ۾ 18-29 جي گروپ، ڌيء، فيبروري ۾ رهندڙ ڪاليج گريجوئيشن جي اندر آهي ته اتي homogeneous جواب propensities. اهڙيء طرح، پوسٽ-stratification وڌائي لاء استعمال گروپن جي تعداد ۾ جيئن، جي assumptions ان کان وڌيڪ مناسب هئڻ جي حمايت ڪرڻ جي ضرورت آهي. هن حقيقت کي ڏنو، ان مان لڳي ٿو ته هڪ تحقيق پوسٽ-stratification لاء گروپن جي هڪ وڏي تعداد ۾ پيدا ڪرڻ چاهي ها وانگر. ڊيٽا sparsity: پر، گروپن وڌائي جو تعداد طور تي، تحقيق هڪ مختلف مسئلو ۾ هلائي. ته اتي هر گروپ ۾ صرف ماڻهن جي هڪ ننڍڙي تعداد ۾ آهن، ان کان پوء ان جي ڪاٿي کان وڌيڪ يقين ٿي ويندو، ۽ پيريء صورت جتي هڪ گروپ في respondents ڪئي آهي ته ڪو آهي ۾، پوء پوسٽ-stratification مڪمل طور تي نازل ڦيرائيندو آھي. نه homogeneous- جواب-propensity-اندر-گروپن گمان ۽ هر گروپ ۾ ڀرپور نموني ڪاٺ جي مطالبي جي plausibility جي وچ ۾ هن پيدائشي عمل ۾ مصالحت کان ٻاهر ٻن طريقن سان آهي. هڪ اچڻ وزن حسابي ۽ ٻين لاء هڪ کان وڌيڪ نفيس انگن ماڊل ڏانهن منتقل ڪرڻ آهي هڪ وڏو، وڌيڪ قسمين قسمين ٺهيل آهي، جنهن کي هر هڪ گروپ ۾ ڀرپور نموني ڪاٺ کي يقيني بنائڻ ۾ مدد ڪري گڏ ڪرڻ آهي. ۽، ڪڏهن ڪڏهن تحقيق ٻنهي ڪندا، ته جيئن مون کي وڌيڪ تفصيل هيٺ بيان ڪنداسين.

هڪ ٻيو غور جڏهن غير ممڪن نموني مان پوسٽ-stratification سان ڪم ڪري ته homogeneous-جواب-propensity-اندر-گروپن گمان ۾ ئي ايف جڏھن ممڪن نموني تجزيو ڪيو آهي. ان جو سبب اهو آهي ته هن گمان ۾ عملي طور ممڪن نموني لاء ضرورت آهي ته ممڪن نموني غير جواب آهي، ۽ غير جواب لاء adjusting لاء سڀ کان عام طريقو تحرير-stratification جيئن مٿي بيان ڪيو آهي. جي حقيقت، بس، ڇاڪاڻ ته ڪيترن ئي تحقيق جو هڪ مخصوص گمان هرگز نه ڪندو آھي ته مان اوھين ان کي به ائين ڪرڻ گهرجي ڪر. پر، ان جو مطلب اهو ٿو ته جڏهن عملي طور ممڪن نموني ڪرڻ غير ممڪن نموني comparing، اسان کي ته ٻنهي امان جي ڪاٿي پيدا ڪرڻ ۾ assumptions ۽ معاون معلومات تي دارومدار رکي ذهن ۾ رکڻ ضروري آهي. سڀ کان حقيقت پسند جوڙ ۾، نه رڳو inference کي ڪو گمان-مفت ۾ اچڻ آهي.

آخر ۾، جيڪڏهن توهان اسان جي مثال بيروزگاري جي شرح ۾-وري ۾ خاص ۾ هڪ اندازي جي باري ۾ خيال اوھان کي هڪ حالت homogeneous-جواب-propensity-اندر-گروپن گمان جي ڀيٽ ۾ وڌيڪ ھيڻو جي ضرورت آهي. خاص طور تي، تون ته هر هڪ ئي جواب propensity اٿس فرض ڪرڻ جي ضرورت نه ڪندا آھن، اوھان کي رڳو فرض هر گروپ جي اندر جواب propensity ۽ بيروزگاري جي شرح ۾ جي وچ ۾ ڪو باهمي تعلق نه آهي ته ضرورت آهي. يقينا، جيتوڻيڪ هن ھيڻو حالت ڪجهه حال ۾ جو عهدو نه ٿيندو. مثال طور، آمريڪا جو اندازو آهي ته رضاڪار ڪم ڪندا estimating رهندا. جيڪي ماڻهو رضاڪار ڪم ڪندا وڌيڪ هڪ سروي ۾ ٿي متفق ڪرڻ جو امڪان آهي ته، پوء تحقيق systematically volunteering، جيڪڏھن اھي پوسٽ-stratification adjustments ڪندا، نتيجي ۾ آهي ته جي empirically demonstrated ڪيو ويو آهي جو مقدار جي حوالي سان-اندازي ڪندو Abraham, Helms, and Presser (2009) .

جيئن مون اڳ چيو ته، غير ممڪن نموني وڏو skepticism سان سماجي سائنسدانن جي، سروي تحقيق جي شروعاتي ڏينهن ۾ ئي سڀ کان وڌيڪ متاثر ذلالت گهوٽالي جو ڪجهه ۾ سندن ڪردار جي ڇو ته ڏٺو آهن حصي ۾. ڪيئن پري اسان کي غير ممڪن نموني سان ايندا آهن جو هڪ چٽو مثال آهي ته صحيح آمريڪي ايڪس استعمال ڪندڙن جي هڪ غير ممڪن نموني استعمال ڪرڻ جو 2012 ع ۾ آمريڪا ۾ چونڊن جي ڪالهه شاهه لطيف جي وي وانگي، دائود Rothschild، شرد Goel، ۽ ٻيو Gelman جي تحقيق آهي آمريڪا جي دادو decidedly غير بي ترتيبي نموني (Wang et al. 2015) . هن تحقيق جي Xbox فورم نظام کان respondents نوڪر، ۽ جيئن اوھان کي اميد ٿئي، ته ايڪس نموني skewed مرد ۽ skewed نوجوان: 18 - 29 سال جي بالغ electorate جي 19٪ پر ايڪس نموني جي 65٪ اپ ڪرڻ ۽ ماڻھن 47٪ مٿي ڪر جي electorate ۽ ايڪس نموني (شڪل 3.4) جو 93 سيڪڙو. ڇو ته انهن کي مضبوط ڊيموگرافڪ پير پساري جي، جي را ايڪس ڊيٽا اليڪشن موٽڻ جي هڪ غريب اشارو هو. اهو بارڪ اوباما جي حوالي سان Mitt Romney لاء هڪ مضبوط فتح اڳڪٿي. وري، هن را، unadjusted غير ممڪن نموني جي خطرن جو ٻيو مثال آهي ۽ ادبي ڦاڙ ٻت جي reminiscent آهي.

شخصيت 3.4: وانگي تاڪين عن ۾ respondents جي Demographics. (2015). ڇو ته respondents Xbox مان نوڪر هئا، اهي وڌيڪ جوان ۽ وڌيڪ مرد ٿيڻ جو امڪان، جو 2012 ع جي چونڊن ۾ ووٽرن کي مائٽ ٿي امڪان هئا.

شخصيت 3.4: ۾ respondents جي Demographics Wang et al. (2015) . ڇو ته respondents Xbox مان نوڪر هئا، اهي وڌيڪ جوان ۽ وڌيڪ مرد ٿيڻ جو امڪان، جو 2012 ع جي چونڊن ۾ ووٽرن کي مائٽ ٿي امڪان هئا.

تنهن هوندي به، وانگي ۽ ساٿيو انهن مشڪلاتن کان واقف هئا ۽ ان جي هوندا عمل لاء درست ڪرڻ جي respondents تور ڪرڻ جي ڪوشش ڪئي. خاص ۾، اهي عهدي-stratification مون جي باري ۾ توهان کي ٻڌايو جي هڪ کان وڌيڪ نفيس فارم استعمال ڪيو. ڇاڪاڻ ته ان پوسٽ-stratification جي باري ۾ وجدان جيڪڏھن، ۽ خاص نسخو وانگي ۽ ساٿيو استعمال weighting غير ممڪن نموني ڪرڻ لاء سڀ کان جوش اچي مان هڪ آهي ان کي انهن جي اچڻ جي باري ۾ هڪ ذرو وڌيڪ سکيا لڳي آهي.

سيڪشن 3.4.1 ۾ يونيورسٽيء estimating جي باري ۾ اسان جي سادي مثال ۾، اسان جي رهائش جي رياست جي بنياد تي گروهن ۾ آبادي جدا. ان جي ابتڙ، وانگي ۽ طريقي جي آبادي ۾ طرفان بيان ڪيو ويو آهي 176.256 گروپن ۾ تقسيم ڪيو: جنس (2 ڀاڱا)، ڄامشورو (4 ڀاڱا)، عمر (4 ڀاڱا)، تعليم (4 ڀاڱا)، رياست (51 ڀاڱا)، پارٽي جي ID (3 ڀاڱا)، نظرين (3 ڀاڱا) ۽ 2008 ع ووٽ (3 ڀاڱا). وڌيڪ گروپن سان، سنڌ جي تحقيق اميد ظاهر ڪئي ته ان کي increasingly امڪان ٿئي ها ته هر هڪ گروپ جي اندر، جواب propensity اوباما لاء مدد سان Uncorrelated هو. اڳيون، بلڪه فرد-سطح وزن بڻائڻ جي ڀيٽ ۾، جيئن اسان کي اسان جي مثال ۾ ڪيائون، وانگي ۽ ساٿيو هڪ پيچيده ماڊل هر گروپ ۾ ماڻهن کي ته اوباما لاء ووٽ ها جي عملن جو اندازو ڪرڻ لاء استعمال ڪري. آخر ۾، اهي هر گروپ جي معلوم ماپ سان حمايت جو اهي گروپ ڪاٿي ٿيل حمايت جي هڪ اندازي مطابق مجموعي سطح تي پيدا ڪرڻ. ٻين لفظن ۾، اهي مختلف گروهن ۾ آبادي مٿي chopped، اندازي مطابق هر گروپ ۾ باراڪ اوباما جي حمايت، ۽ پوء هڪ مجموعي ڪاٿو پيدا ڪرڻ جي گروپ ڪاٿي جي هڪ weighted سراسري ٿي گذريو آهي.

اهڙيء طرح، انهن جي اچڻ ۾ وڏي چئلينج انهن 176.256 گروپن جي هر ۾ باراڪ اوباما جي حمايت جو اندازو ڪرڻ آهي. جيتوڻيڪ سندن پينل 345.858 منفرد ڌرين شامل، چونڊن ۾ پولنگ جي معيار جي هڪ وڏي انگ، اتي ڪيترا، ڪيترن ئي گروپن جنهن لاء وانگي ۽ ساٿيو لڳ ڀڳ في respondents پئي ويا. تنهن ڪري، هر گروپ اھي ڪيترا مان هڪ ٽيڪنڪ پوسٽ-stratification سان multilevel regression سڏيو ويندو آهي، جنهن تي تحقيق affectionately لازمي مسٽر ص سڏ، هڪ مخصوص گروهه جي اندر اوباما جي حمايت جو اندازو ڪرڻ لاء، مسٽر ٽي پي جو پول معلومات استعمال ۾ حمايت جو اندازو ڪرڻ ڄائي سان لاڳاپيل گروپن. مثال طور، 18-29 جي وچ ۾ سالن جي عمر ۾، ڌيء، Hispanics مان اوباما جي حمايت estimating جي چئلينج تي غور جيڪو ڪاليج گريجوئيشن، جيڪي داخل جمهوريت پسند آهن، moderates طور تي جيڪو خود کي سڃاڻڻ آھن، ۽ جيڪي 2008. هن ۾ اوباما لاء ڏيئي هڪ تمام، تمام مخصوص گروهه آهي، ۽ اهو انهن ڪنڀار سان ٺهيل ۾ ڪو به نه آهي ته ممڪن آهي. تنهن ڪري، گڏجي هن گروپ جي باري ۾ اندازي ڪرڻ، مسٽر ٽي پي جو پول بلڪل ساڳي گروپن ۾ ماڻهن کان ڪاٿي.

هن تجزيي حڪمت عملي استعمال ڪري رهيو آهي، وانگي ۽ طريقي جي Xbox غير ممڪن نموني استعمال ڪرڻ جي تمام ويجهي جي مجموعي جي حمايت آهي ته باراڪ اوباما کي 2012 ع جي چونڊن ۾ (شڪل 3.5) ۾ ملي جو اندازو ڪري سگهندا هئا. حقيقت ۾ انهن جو ڪاٿو عوامي راء موجود سمورين جي گڏيل عددي معلومات حاصل جي ڀيٽ ۾ وڌيڪ درست هئا. اهڙيء طرح، هن معاملي ۾، weighting-خاص مسٽر هڪ سٺو غير ممڪن ڊيٽا ۾ پير پساري کي درست ڪرڻ نوڪري ڪندا ص-لڳي؛ پير پساري ته نظر اچي رهيا آهن جڏهن توهان جي unadjusted ايڪس انگن اکرن کان انومان تي نظر.

شخصيت 3.5: وانگي تاڪين عن کان ڪاٿي. (2015). Unadjusted Xbox نموني غلط انومان جي روپ ۾. پر، جي weighted Xbox نموني ڪاٿي ته ممڪن جي بنياد تي ٽيلي فون سروي جي سراسري کان وڌيڪ صحيح هئا جي روپ ۾.

شخصيت 3.5: مان ڪاٿي Wang et al. (2015) . Unadjusted Xbox نموني غلط انومان جي روپ ۾. پر، جي weighted Xbox نموني ڪاٿي ته ممڪن جي بنياد تي ٽيلي فون سروي جي سراسري کان وڌيڪ صحيح هئا جي روپ ۾.

نه وانگي ۽ طريقي جي مطالعي مان ٻه مکيه سبق آهي. پهريون، unadjusted غير ممڪن نموني خراب ڪاٿي رسي سگهي ٿو. هن هڪ سبق آهي ته ڪيترن ئي تحقيق کان اڳ ٻڌو آهي. تنهن هوندي به، جي ٻئي سبق آهي ته غير ممڪن نمونو آهي، جڏهن صحيح weighted، اصل ۾ ڪافي سٺو انومان پيدا ڪري سگهي ٿو. حقيقت ۾، انهن جو ڪاٿو، وڌيڪ روايتي چونڊن ۾ چونڊن جو هڪ aggregation pollster.com کان ڪاٿي جي ڀيٽ ۾ وڌيڪ درست هئا.

آخر ۾، اتي اسان کي ڇا هي هڪ مخصوص جي مطالعي مان معلوم ٿئي ٿو لاء اهم حدن آهن. بس، ڇاڪاڻ ته پوسٽ-stratification هن خاص صورت ۾ چڱي ڪم ڪيو، اتي ڪا به ضمانت نه آهي ته ان کي ٻين ڪيسن ۾ چڱي ڪم ڪندو آهي. حقيقت ۾، چونڊن ڇاڪاڻ ته pollsters (اسين ڏسي سگهو ٿا جن جي چونڊن جيت) لڳ ڀڳ 100 سالن لاء چونڊن ۾ زير تعليم آهن ڪيو ويو، باقاعده موٽ نه آھي، ۽ پارٽي جي سڃاڻپ ۽ ڊيموگرافڪ ڪنڀار ووٽنگ جي نسبتا predictive آهن شايد ئي سڌو جوڙ مان هڪ آهي. هن موقعي تي، اسان کي بيڪار نظريو ۽ شعوري تجربو هجڻ معلوم ڪرڻ لاء جڏهن غير ممڪن نموني کي weighting adjustments سڀني صحيح انومان پيدا ڪندو. هڪ شيء آهي ته واضح آهي، تنهن هوندي به، ۽ جيڪڏھن اوھان کي غير ممڪن نموني سان ڪم ڪرڻ تي مجبور آهن، ان کان پوء اتي مؤمنن کي ته ڪرڻي ڪاٿي غير ڪرڻي ڪاٿي جي ڀيٽ ۾ بهتر ٿيندو مضبوط سبب آهي.