3.4.2 غیر احتمال نمونے: ویٹنگ

یہ ترجمہ ایک کمپیوٹر کے ذریعے پیدا کیا گیا تھا. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 غیر احتمال نمونے: ویٹنگ

غیر احتمال نمونے کے ساتھ، وزن فرض کے نمونے لینے کے عمل کی وجہ سے کیا بگاڑ رد کر سکتے ہیں.

محققین احتمال نمونے کے جوابات وزن اسی اسی طرح، وہ بھی غیر احتمال نمونے کے جوابات کر سکتے ہیں وزن. مثال کے طور پر، CPS کے لئے ایک متبادل کے طور پر، کہ آپ نے بے روزگاری کی شرح کا اندازہ کرنے کے ایک سروے کے لئے شرکاء کو بھرتی کرنے کی ہزاروں ویب سائٹ پر بینر اشتھارات رکھے تصور. قدرتی طور پر، اگر آپ کو شبہ ہے کہ آپ کے نمونہ کی سادہ مطلب بے روزگاری کی شرح میں سے ایک اچھا تخمینہ ہونگے. آپ کو کچھ لوگوں کو دوسروں کے مقابلے میں آپ سروے مکمل کرنے کا امکان زیادہ ہیں کہ لگتا ہے کہ کیونکہ آپ کے شکوک و شبہات شاید ہے. مثال کے طور پر، لوگوں کو ویب پر وقت کی ایک بہت خرچ نہیں کرتے جو آپ کے سروے مکمل کرنے کے امکان کم ہیں.

ہم نے گزشتہ سیکشن میں دیکھا کے طور پر، تاہم، ہم جانتے ہیں کہ اگر نمونہ منتخب کیا کے طور پر کیا گیا تھا کہ کس طرح ہم احتمال کے ساتھ کیا نمونوں-پھر ہم نمونے لینے کے عمل کی وجہ سے بگاڑ رد کر سکتے ہیں. بدقسمتی سے، غیر احتمال نمونے کے ساتھ کام کرتے وقت، ہمیں معلوم نہیں نمونہ منتخب کیا گیا ہے کہ کس طرح جانتے. لیکن، ہم نمونے لینے کے عمل کے بارے میں مفروضات بنا سکتے ہیں اور اس کے بعد اسی طرح میں weighting کے لاگو ہوتے ہیں. ان مفروضات درست ہیں، تو پھر weighting کے نمونے لینے کے عمل کی وجہ سے بگاڑ کالعدم گا.

مثال کے طور پر، اپنے بینر والے اشتہارات کے جواب میں، آپ کو 100،000 مدعا بھرتی کہ تصور. تاہم، اگر آپ ان میں سے 100،000 مدعا امریکی بالغوں کے ایک سادہ بے ترتیب نمونے ہیں کہ یقین نہیں کرتے. اصل میں، آپ امریکی آبادی کے لئے اپنے مدعا کا موازنہ جب، آپ کو کہ کچھ ریاستوں (مثلا، نیویارک) سے لوگوں کو کچھ ریاستوں (مثلا، الاسکا) سے زیادہ نمائندگی اور یہ کہ لوگوں کی نمائندگی کر رہے ہیں تلاش کریں. اس طرح، آپ کے نمونہ کی بے روزگاری کی شرح ہدف آبادی میں بے روزگاری کی شرح کی ایک بری تخمینہ ہونے کا امکان ہے.

مسخ کے نمونے لینے کے عمل میں ہوا ہے کہ کالعدم کرنے کا ایک طریقہ ہر شخص کو وزن تفویض کرنے کے لئے ہے؛ ریاستوں کے لوگوں کے لئے کم وزن کی ہیں نمونے (مثلا، الاسکا) میں کم نمائندگی کہ ریاستوں کے لوگوں کے لئے نمونہ ہیں (مثلا، نیویارک) اور اعلی وزن میں زیادہ نمائندگی کر رہے ہیں کہ. مزید خاص طور پر، ہر ایک مدعا کے لئے وزن امریکی آبادی میں ان کی ویاپتتا کے لئے آپ کے نمونے رشتہ دار میں ان کی ویاپتتا سے متعلق ہے. یہ weighting کے طریقہ کار کے بعد کی ستریکرن کہا جاتا ہے، اور وزن کے خیال کو جہاں رہوڈ آئی لینڈ سے مدعا کیلی فورنیا سے مدعا سے کم وزن میں دی گئی تھیں دفعہ 3.4.1 میں مثال کی یاد دلاتے چاہئے. پوسٹ- ستریکرن آپ گروپوں میں آپ مدعا ڈال دیا اور ہر گروپ میں ہدف آبادی کے تناسب معلوم کرنے میں کافی جانتے کہ اس کی ضرورت.

امکان نمونہ کے اور غیر احتمال نمونہ کے وزن ایک ہی ریاضی (ٹیکنیکل اپینڈکس ملاحظہ کریں) ہیں، وہ مختلف حالات میں اچھی طرح کام. محقق ایک کامل امکان نمونہ (یعنی کوئی کوریج کی خرابی اور کوئی غیر جواب) نہیں ہیں تو weighting کے تمام معاملات میں تمام خصلتوں کے لئے غیر جانبدار اندازوں پیدا کرے گا. یہ مضبوط نظریاتی ضمانت کیوں احتمال نمونوں کی وکالت انہیں اتنی کشش ہے. دوسری طرف، weighting کے غیر احتمال نمونے صرف تمام خصلتوں کے لئے غیر جانبدار اندازوں کے جواب propensities ہر گروپ میں سب کے لئے ایک ہی ہیں تو پیدا کرے گا. دوسرے الفاظ میں،، ہماری مثال واپس سوچ پوسٹ ستریکرن کا استعمال کرتے ہوئے غیر جانبدار اندازوں پیدا کرے گا نیویارک میں ہر کوئی حصہ لے اور الاسکا میں سب کو اسی طرح حصہ لینے اور کے اسی امکان ہے کے اسی احتمال ہو تو. یہ مفروضہ یکساں-جواب-propensities کے اندر اندر گروپوں مفروضہ کہا جاتا ہے، اور بعد از ستریکرن غیر احتمال نمونے کے ساتھ اچھی طرح کام کرے گا تو یہ جانے میں اہم کردار ادا کرتا ہے.

بدقسمتی سے، ہماری مثال میں، یکساں-جواب-propensities گروپوں اندر مفروضہ سچ ہو امکان نہیں لگتا ہے. یہ ہے کہ، یہ امکان نہیں لگتا الاسکا میں ہر کوئی آپ کے سروے میں ہونے کا ایک ہی امکان ہے کہ. لیکن، بعد از ستریکرن بارے میں ذہن میں رکھنے کے لئے تین اہم پوائنٹس، یہ زیادہ امید افزا لگ رہے ہو جس کے تمام موجود ہیں.

سب سے پہلے، یکساں-جواب-propensities گروپوں اندر مفروضہ گروپوں کی تعداد میں اضافہ کے طور پر زیادہ قرین قیاس ہو جاتا. اور، محققین صرف ایک جغرافیائی طول و عرض کی بنیاد پر گروہوں تک محدود نہیں ہیں. مثال کے طور پر، ہم ریاست، عمر، جنس، اور تعلیم کی سطح کی بنیاد پر گروہوں پیدا کر سکتا ہے. ، الاسکا میں رہنے والے تمام لوگوں کے گروپ میں سے زیادہ الاسکا میں رہنے والے لڑکی، کالج گریجویٹس اس 18-29 کے گروپ کے اندر یکساں ردعمل کا propensities ہے کہ وہاں زیادہ ممکنہ لگتا ہے. اس طرح، پوسٹ ستریکرن اضافہ کے لئے استعمال کیا گروپوں کی تعداد کے طور پر، مفروضات یہ زیادہ معقول بننے کی حمایت کی ضرورت. اس حقیقت کو دیکھتے ہوئے، یہ ایک محققین طرح بعد از ستریکرن کے گروپوں کی ایک بڑی تعداد پیدا کرنے کے لئے چاہتے ہیں لگتا ہے. اعداد و شمار کے sparsity: لیکن، گروپوں میں اضافہ کی تعداد کے طور پر، محققین ایک مختلف مسئلہ میں چلاتے ہیں. ہر گروپ میں لوگوں کی صرف ایک چھوٹی سی تعداد میں موجود ہیں، تو پھر اندازوں زیادہ غیر یقینی ہو جائے گا، اور انتہائی صورت میں کوئی مدعا ہے کہ ایک گروپ ہے جہاں، پھر بعد از ستریکرن مکمل طور پر نیچے ٹوٹ جاتا ہے. homogeneous- کے جواب-پدررتی گروپوں اندر مفروضہ کی دکھاوٹ اور ہر گروپ میں مناسب نمونے کے سائز کے لئے مانگ کے درمیان اس موروثی کشیدگی کے باہر دو طریقے ہیں. ایک نقطہ نظر کے وزن کے حساب کے لئے ایک زیادہ بہتر شماریاتی ماڈل پر منتقل کرنے کے لئے ہے اور دوسرے کو یقینی بنانے کے ہر گروپ میں مناسب نمونے کے سائز میں مدد کرتا ہے جس میں ایک وسیع تر، زیادہ متنوع نمونے، جمع ہے. اور، کبھی کبھی محققین، دونوں میں ذیل میں مزید تفصیل سے بیان کریں گے کے طور پر.

جب غیر احتمال نمونوں سے پوسٹ ستریکرن کے ساتھ کام ایک دوسرے سے غور امکان نمونوں کا تجزیہ کرتے وقت یکساں-جواب-پدررتی گروپوں اندر مفروضہ پہلے سے ہی اکثر بنایا جاتا ہے کہ ہے. وجہ یہ مفروضہ پریکٹس میں احتمال نمونوں کے لئے کی ضرورت ہے کہ احتمال کے نمونے غیر رد عمل کی ضرورت ہے، اور جیسا کہ اوپر بیان غیر جواب کے لئے ایڈجسٹ کرنے کے لئے سب سے عام طریقہ پوسٹ ستریکرن ہے. کورس کے، بہت سے محققین ایک مخصوص مفروضہ مطلب یہ نہیں کہ تم بھی یہ کرنا چاہئے کہ بنانے صرف اس وجہ سے. لیکن، اس کا مطلب یہ عملی طور پر امکان کے نمونوں کو غیر احتمال نمونوں کا موازنہ جب، ہم ذہن دونوں تخمینے پیدا کرنے کے لئے مفروضات اور منسلک نقلو معلومات پر منحصر ہے کہ میں رکھنا ضروری ہے کہ کرتا ہے. سب سے زیادہ حقیقت پسندانہ ترتیبات میں، صرف اندازہ کرنے کی کوئی مفروضہ پاک نقطہ نظر نہیں ہے.

آخر میں، آپ کے بارے میں ایک اندازے پرواہ ہے تو ہماری مثال میں بے روزگاری بالخصوص ان کی شرح تو آپ کو ایک کی حالت یکساں-جواب-پدررتی کے اندر اندر گروپوں مفروضہ کے مقابلے میں کمزور کی ضرورت. خاص طور پر، آپ کو صرف ہر گروپ کے اندر اندر جواب پدررتی اور بے روزگاری کی شرح کے درمیان کوئی تعلق نہیں ہے کہ فرض کرنے کی ضرورت ہے، ہر کوئی ایک ہی جواب پدررتی ہے کہ فرض کرنے کی ضرورت نہیں ہے. کورس کے، یہاں تک کہ اس کمزور حالت کے کچھ حالات میں پکڑ نہیں کرے گا. مثال کے طور پر، رضاکارانہ کام کرتے ہیں کہ امریکیوں کے تناسب کا اندازہ تصور. جو رضاکارانہ کام کرتے لوگ ایک سروے میں شرکت سے متفق ہونے کا امکان زیادہ ہیں، تو پھر محققین گا منظم طریقے سے زیادہ کا اندازہ لگانے رضاکارانہ کی رقم، وہ بعد از ستریکرن ایڈجسٹمنٹ ایک نتیجہ کی طرف سے کو empirically مظاہرہ کیا گیا ہے کہ یہاں تک کہ اگر، Abraham, Helms, and Presser (2009) .

میں نے پہلے کہا تھا کہ غیر احتمال نمونوں عظیم شکوک و شبہات کے ساتھ سماجی سائنسدانوں کی طرف سے، حصے میں، کیونکہ سروے تحقیق کے ابتدائی دنوں میں سب سے زیادہ شرمناک ناکامی کے کچھ میں ان کے کردار کے دیکھا جاتا ہے. ہم کس حد تک غیر احتمال نمونے کے ساتھ آئے ہیں کی ایک واضح مثال صحیح امریکی ایکس باکس صارفین کی ایک غیر احتمال نمونے کا استعمال کرتے ہوئے 2012 امریکی انتخابات کے نتائج برآمد کیا ہے کہ وی وانگ، ڈیوڈ Rothschild کی، شرد گویل، اور اینڈریو Gelman کی تحقیق ہے -A امریکیوں کی واضع طور پر غیر بے ترتیب نمونے (Wang et al. 2015) . محققین ایکس بکس گیمنگ نظام سے مدعا بھرتی، اور کے طور پر آپ توقع کر سکتے، ایکس باکس نمونہ مرد سے skewed اور نوجوان سے skewed: 18 - 29 سال کے بچوں ووٹر کے 19 فیصد ہے لیکن ایکس بکس نمونہ کے 65 فی صد ہے اور مردوں میں 47 فی صد ہے ووٹر اور ایکس بکس نمونہ (چترا 3.4) کا 93 فیصد کی. کیونکہ ان مضبوط آبادیاتی تعصبات کی، خام ایکس بکس ڈیٹا کے انتخابات ریٹرن کے ایک غریب اشارے تھا. یہ براک اوباما سے زیادہ مٹ رومنی کے لئے ایک مضبوط فتح کی پیش گوئی کی. ایک بار پھر، اس خام، اسایڈجت غیر احتمال نمونے کے خطرات کی ایک اور مثال ہے اور ادبی ڈائجسٹ ناکامی کی یاد تازہ ہے.

پیکر 3.4: وانگ ET اللہ تعالی کے مدعا کی آبادی. (2015). کیونکہ مدعا ایکس باکس سے بھرتی کیا گیا، وہ نوجوان اور 2012 کے انتخابات میں ووٹروں کے رشتہ دار مرد، ہونے کا امکان زیادہ ہو جائے کے امکانات زیادہ تھے.

پیکر 3.4: برائے مدعا کی آبادی Wang et al. (2015) . کیونکہ مدعا ایکس باکس سے بھرتی کیا گیا، وہ نوجوان اور 2012 کے انتخابات میں ووٹروں کے رشتہ دار مرد، ہونے کا امکان زیادہ ہو جائے کے امکانات زیادہ تھے.

تاہم، وانگ اور ان کے ساتھیوں کو ان مسائل سے آگاہ تھے اور نمونے لینے کے عمل کے لئے درست کرنے کے لئے مدعا وزن کرنے کی کوشش کی. خاص طور پر، وہ بعد از ستریکرن کے بارے میں میں نے آپ کو بتایا کے ایک سے زیادہ جدید ترین فارم پر استعمال کیا. یہ پوسٹ ستریکرن بارے انترجشتھان بناتا کیونکہ ان کے نقطہ نظر کے بارے میں تھوڑا سا زیادہ سیکھنے کے قابل ہے، اور خاص طور پر ورژن وانگ اور ان کے ساتھیوں پر استعمال کیا weighting کے غیر احتمال نمونے کے سب سے زیادہ دلچسپ طریقوں میں سے ایک ہے.

دفعہ 3.4.1 میں بے روزگاری کا اندازہ بارے میں ہمارے سادہ مثال میں، ہم نے رہائش گاہ کے ریاست پر مبنی گروپوں میں تقسیم کیا آبادی. اس کے برعکس، وانگ اور ان کے ساتھیوں کی طرف سے وضاحت 176.256 گروپوں میں میں آبادی تقسیم: صنفی (2 اقسام)، دوڑ (4 اقسام)، عمر (4 اقسام)، تعلیم (4 اقسام)، ریاست (51 اقسام)، پارٹی ID (3 زمرہ جات)، نظریے (3 اقسام) اور 2008 ووٹ (3 اقسام). زیادہ گروپوں کے ساتھ، محققین نے امید ظاہر کی کہ یہ ہر گروپ کے اندر اندر، اس کے جواب پدررتی اوباما کے لئے حمایت کے ساتھ uncorrelated تھا کہ تیزی کا امکان ہو جائے گا کہ. اگلا، بلکہ انفرادی سطح کے وزن کی تعمیر ہم اس مثال میں نے کے طور پر کے مقابلے میں، وانگ اور ان کے ساتھیوں کو ایک پیچیدہ ماڈل ہر گروپ اوبامہ کو ووٹ دیں گے کہ میں لوگوں کے تناسب کا اندازہ لگانے کے لئے استعمال کیا. آخر میں، وہ حمایت کے اندازا مجموعی سطح پیدا کرنے کے لئے ہر گروپ کے نام سے جانا جاتا کے سائز کے ساتھ کی حمایت کی ان کے گروپ اندازوں مل کر. دوسرے الفاظ میں، وہ آبادی مختلف گروپوں میں، کٹی ہر گروپ میں اوباما کے لئے حمایت کے اندازے کے مطابق، اور پھر مجموعی تخمینہ پیدا کرنے کے لئے گروپ کے اندازوں کی ایک بارت اوسط لیا.

اس طرح، ان کے نقطہ نظر میں بڑا چیلنج ان 176.256 گروہوں میں سے ہر ایک میں اوباما کے لئے حمایت کا اندازہ لگانے کے لئے ہے. اگرچہ ان کے پینل 345.858 منفرد شرکاء، انتخابات میں پولنگ کے معیار کی طرف سے ایک بڑی تعداد بھی شامل ہے، بہت سے، بہت سے ایسے گروپ ہیں جس کے لئے وانگ اور ان کے ساتھیوں تقریبا کوئی مدعا تھا وہاں تھے. لہذا، ہر گروپ وہ ایک ٹیکنالوجی کا استعمال کیا جس کے محققین پیار سے ایک مخصوص گروپ کے اندر اوباما کے لئے حمایت کا اندازہ لگانے کے لئے بنیادی طور پر مسٹر پی کو فون،، مسٹر پی تالابوں بہت سے معلومات پوسٹ ستریکرن کے ساتھ بہستر رجعت بلایا، میں حمایت کا اندازہ کرنا قریب سے متعلق گروپوں. مثال کے طور پر، کالج سے فارغ التحصیل، ڈیموکریٹس رجسٹرڈ ہیں جو، بطور اعتدال پسند خود کو شناخت کرنے والے کون ہیں، اور یہ 2008. میں اوباما کے لئے ووٹ دیا جو 18-29 سال کی عمر کے درمیان،، خاتون Hispanics کے درمیان اوباما کے لئے حمایت کا اندازہ کرنے کے چیلنج پر غور، ایک بہت، بہت ہی خاص گروپ ہے، اور یہ ان خصوصیات کے ساتھ نمونے میں کوئی نہیں ہے کہ ممکن ہے. لہذا، اس گروپ کے بارے میں تخمینوں بنانے کے لئے، مسٹر پی تالابوں مل کر بہت ہی اسی گروپ میں لوگوں کی طرف سے اندازہ لگایا ہے.

اس تجزیے کی حکمت عملی کا استعمال کرتے ہوئے، وانگ اور ان کے ساتھیوں کو بہت قریب سے اوباما 2012 کے انتخابات میں موصول ہوئی ہے کہ مجموعی طور پر حمایت کا اندازہ لگانے کے لئے ایکس بکس غیر احتمال نمونے کا استعمال کرنے کے قابل تھے (شکل 3.5). دراصل ان کے اندازوں رائے عامہ کے جائزوں کے ایک مجموعی مقابلے میں زیادہ درست تھے. اس طرح، اس معاملے میں، weighting کے-خاص طور پر مسٹر غیر احتمال ڈیٹا میں تعصبات کو درست کرنے کا ایک اچھا کام کرنے P.-لگتا ہے؛ آپ اسایڈجت ایکس بکس ڈیٹا سے اندازوں پر نظر ڈالیں تو حاصل ہے کہ تعصبات.

پیکر 3.5: وانگ ET اللہ تعالی کی جانب سے تخمینوں. (2015). اسایڈجت ایکس باکس نمونہ غلط اندازوں کی پیداوار ہے. لیکن، بارت ایکس باکس نمونہ امکان کی بنیاد پر ٹیلی فون سروے کی اوسط سے زیادہ درست تھے کہ اندازوں سے تیار.

پیکر 3.5: کی جانب سے تخمینوں Wang et al. (2015) . اسایڈجت ایکس باکس نمونہ غلط اندازوں کی پیداوار ہے. لیکن، بارت ایکس باکس نمونہ امکان کی بنیاد پر ٹیلی فون سروے کی اوسط سے زیادہ درست تھے کہ اندازوں سے تیار.

وانگ اور ان کے ساتھیوں کے مطالعہ سے دو اہم سبق نہیں ہیں. سب سے پہلے، اسایڈجت غیر احتمال نمونے برا اندازوں کی قیادت کر سکتے ہیں؛ یہ بہت سے محققین سے پہلے سنا ہے کہ ایک سبق ہے. تاہم، دوسرا سبق ہے کہ غیر احتمال نمونے، مناسب طریقے سے بارت جب، اصل میں بہت اچھا اندازوں کے پیدا کر سکتا ہے. اصل میں، ان اندازوں pollster.com، زیادہ روایتی انتخابی انتخابات کا یکتریقرن سے اندازوں سے کہیں زیادہ درست تھے.

آخر میں، ہم اس میں سے ایک مخصوص مطالعہ سے سیکھ سکتے ہیں کیا کرنا اہم حدود ہیں. صرف اس وجہ سے پوسٹ ستریکرن اس خاص معاملے میں اچھا کام کیا، کوئی ضمانت نہیں کہ یہ دوسری صورتوں میں اچھی طرح کام کرے گا کہ وہاں ہے. سچ تو یہ ہے، انتخابات شاید سب سے آسان ترتیبات میں سے ایک ہیں، کیونکہ امیدوں تقریبا 100 سال تک انتخابات کا مطالعہ کر دیا گیا ہے، باقاعدہ رائے (ہم انتخابات کون جیتتا دیکھ سکتے ہیں)، اور پارٹی کے شناختی ہے اور آبادیاتی خصوصیات ووٹنگ کی نسبتا امکانات ہیں. اس مرحلے پر، ہم ٹھوس اصول اور غیر احتمال نمونے کے سے weighting ایڈجسٹمنٹ کافی درست اندازوں پیدا کرے گا جب آپ کو معلوم کرنے کے لئے عملی تجربے کی کمی ہے. ایک بات واضح ہے کہ، تاہم، آپ کو غیر احتمال نمونے کے ساتھ کام کرنے پر مجبور کر رہے ہیں تو، پھر یقین کرنا ایڈجسٹ اندازوں غیر ایڈجسٹ اندازوں کے مقابلے میں بہتر ہو جائے گا کہ مضبوط وجہ نہیں ہے.