3.4.2 د غیر احتمال نمونې: د وزن

له غير احتمال نمونې، وزن کولای تحریف فرضي نمونه د پروسې له امله را وپرزوي.

په همدې ډول چې د څېړونکو له احتمال نمونې ځوابونه وزن، کوالی شي هغوی له غیر احتمال نمونې ځوابونه هم وزن. د مثال په توګه، د CPS یو بدیل په توګه، فرض وکړئ چې تاسې د ويب زرګونو بيرغ مربوط ځای د يوې سروې چې د بې کارۍ کچه اټکل د ګډون کوونکو لپاره استخدام کړي. طبعا، تاسو به د شک لري، چې د خپل نمونه ساده مانا به د بې کارۍ کچه يو ښه اټکل وي. ستاسو شک دی ښايي ځکه چې تاسو فکر کوئ، چې ځينې خلک ډیر احتمال شته چې د نورو په پرتله د خپل سروې بشپړه کړي. د مثال په توګه، هغه خلک چې نه وېب باندې د ډېر وخت مصرف لږ احتمال لري چې ستاسو د سروې بشپړه کړي.

څرنګه چې په وروستۍ برخه وليدل، خو که موږ پوه نمونه انتخاب شوې وه-وکړو، لکه د احتمال نه نمونې-نو موږ کولای شو د تحریف د نمونې د پروسې له امله را وپرزوي. له بده مرغه، کله چې د غیر احتمال نمونې کار کوي، موږ نه پوهیږو چې څه ډول نمونه انتخاب شوې وه. خو، موږ کولای شو چې د نمونه اخیستنې د بهیر په اړوند انګیرنې کړي او بیا په ورته ډول د وزن کولو غوښتنه وکړي. که د دغو انګیرنو د سمې دي، نو د وزن به د تحریف د نمونې د پروسې له امله را وپرزوي.

د مثال په توګه، تصور چې خپل بيرغ مربوط په ځواب کې، له 100،000 ځواب کې استخدام شي. خو تاسو باور نه لرم چې دا 100،000 ځواب د امریکا د لويانو يو ساده تصادفي نمونه دي. په حقيقت کې، کله چې تاسو د خپل ځواب د امریکا خلکو ته په پرتله، تاسو څخه ځینې ایالتونه (د بيلګې په، نیویارک) خلک، چې له يو شمېر هېوادونو لکه (الاسکا) په استازیتوب او د خلکو د ګډون کم دي. په دې توګه، د خپل نمونه بې کارۍ کچه دی احتمال لري چې د د په هدف د نفوسو د بې کارۍ کچه بد اټکل وي.

د تحريف چې د نمونې په بهير کې رامنځ ته را وپرزوي یوه لاره دا ده چې هر کس د وزن وټاکي؛ ولسي څخه د دولتونو د خلکو وزن چې له هېوادونو ته چې د نمونه (د بيلګې په توګه، الاسکا) لاندې-استازيتوب په نمونه (د بيلګې په توګه، د نیویارک) او د لوړو وزن د خلکو له-استازيتوب. په ځانګړې توګه، د هر ځواب د وزن ستاسو په نمونه خپلوان د خپلو د امریکا د خلکو په شیوع د خپلو شیوع تړاو لري. دا د وزن کړنلاره ده-طبقه وروسته په نامه، او د وزن د مفکوره بايد په 3.4.1 برخه د مثال په توګه تاسو ته یاد دي چې د پراويدنس په ځواب د کاليفورنيا د ځواب څخه کم وزن ورکړل شوي. Post-طبقه غواړي چې ته په کافي اندازه ستاسو د ځواب په ګروپونو او په هر ګروپ د هدف نفوس نسبت پوه پوهيږي.

که څه هم د احتمال نمونه او د غیر احتمال نمونه د وزن د يو ریاضی (د تخنیکي ضمیمه وګورئ)، نو ښه په بېلابېلو شرايطو کې کار وکړي. که څېړونکی يوه مکمله احتمال نمونه (یعنې، د پوښښ تېروتنه نه او غیر هيڅ غبرګون نه) لري، نو د وزن به په ټولو قضيو کې د ټولو خاصيتونو طرفه اټکل توليدوي. دا قوي نظري تضمين ده چې ولې د احتمال نمونې مدافعينو پيدا يې دومره په زړه پورې. له بلې خوا، د وزن د غیر احتمال نمونې به يوازې د ټول خاصيتونه طرفه اټکل که ځواب propensities لپاره په هر ګروپ هر څوک يو شان دي توليد کړي. په بل عبارت، زموږ د مثال په توګه بېرته فکر،-طبقه وروسته د په کارولو سره به د بې طرفه اټکل توليد که په نیویارک کې هر څوک د ګډون او په الاسکا هر څوک د ګډون او داسې ورته احتمال لري په همدې احتمال لري. دا فرضيه د ده د همډوله-ځواب-propensities-دننه ډلو انګیرنې په نامه، او په عالم غږوي دا يو مهم رول که چيري د طبقه وروسته به د غیر احتمال نمونې ښه کار وکړي.

له بده مرغه، زموږ د مثال په توګه، د همډوله-ځواب-propensities-دننه ډلو انګیرنې بريښي چې رښتيا هم وي داسې ښکاري. دا ده چې، چې دا ناشونې ښکاري چې په الاسکا هر څوک د په خپل سروې همدې احتمال لري. خو، درې مهم ټکي ته په پام-طبقه وروسته په اړه وساتي، چې دا ټول دا هیله ښکاري لپاره موجود دي.

لومړی، همډوله-ځواب-propensities-دننه ډلو انګیرنې شي د ډلو زياتوالي د شمېر په توګه زيات راغلې. او، څیړونکو ډلو ته يوازې په يو جغرافيايي بعد بنسټ محدود نه دي. د مثال په توګه، موږ د ډلو د جوړولو پر بنسټ د دولت، عمر، جنس، او د زده کړې د کچې. دا مطلب د خصوصیاتو په ده چې د 18-29 د ډلې په چوکاټ کې همډوله ځواب propensities ښکاري، ښځينه، پوهن فارغانو د ټولو خلکو په الاسکا کې ژوند کوي د ډلې په چوکاټ کې په پرتله په الاسکا کې ژوند کوي. ځکه نو، د ډلو لپاره د طبقه وروسته د زياتوالي کارول د شمېر په توګه، د انګیرنو ملاتړ دا معقوله شي ته اړتیا لري. دې حقيقت ته په پام سره داسې ښکاري لکه یو څېړونکو به غواړي چې د for-طبقه وروسته ډلو ستر شمېر رامنځ ته کړي. د معلوماتو sparsity: خو، د ډلو زياتوالي د شمېر په توګه، د څېړونکو په یوه بیله ستونزه کړي. که يوازې د په هر ګروپ کې لږ شمیر خلکو ته شتون لري، نو د اټکل له مخې به ډير ناڅرګند وي، او په سخت حالت کې چې یوه ډله چې د نه ځواب لري موجود وي، نو-طبقه وروسته په بشپړه توګه مات شو. د ځواب-تمایل-دننه ډلو homogeneous- فرضيه د باور کولو او د مناسب نمونه اندازي په هر ګروپ د غوښتنې تر منځ دغه ذاتي تشنج څخه دوه لاری شته دی. یوه الره او طریقه ده چې د وزن د محاسبي د يو عصري احصایوي موډل حرکت او بل دا دی چې د یوه لوی، ډول ډول نمونه، چې معقول نمونه اندازي په هر ګروپ ډاډ سره مرسته راټول کړي. او، کله کله څيړونکو د کار، ځکه زه به په ډیر تفصیل سره لاندی تشریح.

دوهم په پام کې کله چې له غیر احتمال نمونې-طبقه وروسته کار ده چې د همډوله-ځواب-تمایل-دننه ډلو انګیرنې لا وار وار کړې کله چې احتمال نمونې تحلیل کوي. په دې دليل چې په عمل کې د احتمال نمونې دغه انګيرنه اړین دی دا دی چې احتمال نمونې غیر ځواب لري، او د د غیر ځواب تنظیم د ډير عام ميتود په توګه تشريح پورته طبقه وروسته ده. البته، يوازې له دې امله ډېر څېړونکي لپاره يو خاص فرضيه مانا نه ده چې تاسو بايد دا هم نه. خو دا د دې مانا چې کله چې د احتمال نمونې په عمل کې غیر احتمال نمونې په پرتله، موږ باید په ذهن کې چې د دواړو په موخه د اټکلونو د توليد پر انګیرنو او کومکي معلومات پورې تړلې وساتي. په ډېرو واقعي امستنې، هلته د ګمان په وړيا روش نه پرتلي ساده ده.

که په پای کې په ځانګړی ډول زموږ د بې کارۍ مثال په اړه یو اټکل پروا تاسو کچه نو بيا تاسو د یوه شرط همډوله-ځواب-تمایل-دننه ډلو انګیرنې په پرتله کمزوري ته اړتيا لري. په ځانګړې توګه، تاسو ته اړتيا نه لري په غاړه واخلي، چې هر څوک ورته په ځواب کې تمایل لري، تاسو بايد يواځې د په غاړه واخلي چې د هرې ډلې په چوکاټ کې ځواب تمایل او د بې کارۍ کچه تر منځ د ارتباط نه شته. البته، حتی دا کمزوری حالت به په ځينو حالاتو کې نه لري. د مثال په توګه، تصور د امریکایانو چې داوطلب کار تناسب اټکل. که خلک چې داوطلب کار ډیر احتمال شته چې موافقه وکړه چې په يوه سروې وي، نو څېړونکو به په سيستماتيک ډول له-اټکل د رضاکارانه اندازه، آن که-طبقه وروسته د تعديل په کار، په پایله کې چې د له خوا د ازمایښتونوله شوی Abraham, Helms, and Presser (2009) .

لکه څنګه چې ما مخکې وويل، غیر احتمال نمونې سره غوره شک ټولنيز پوهان له خوا په برخه کې، ځکه د د سروې څیړنو په لومړیو ورځو کې تر ټولو د شرم ناکامي ځينو کې د خپل رول په سترګه ګوري،. د څه ډول تر اوسه مو له غير احتمال نمونې راغلي دي يوه څرګنده بیلګه ده د Wei وانګ، David روچيلډ، Sharad Goel، او Andrew Gelman د څېړنې چې په سمه توګه د 2012 کال د امریکا د ټاکنو د پایلو ترلاسه د امریکا د Xbox کاروونکو یو غیر احتمال نمونه په کارولو هدفي د امریکایانو بېلکل غیر تصادفي نمونه (Wang et al. 2015) . څیړونکي د XBox لوبیدو سيستم څخه ځواب استخدامېږي، او کېدی شي چې تاسو هيله درلوده د Xbox نمونه نارينه جيبونو او شخصي جيبونو ته ځوان: 18 - 29 کلن د رايه ورکوونکو 19٪ خو د Xbox نمونه 65٪ جوړوي او نارينه جوړوي 47٪ د رايه ورکوونکو او د Xbox نمونه (3.4 شکل کې) 93٪. د دې قوي د وګړو د تعصب له امله، د خامو Xbox د معلوماتو د ټاکنو د بېرته يو غريب شاخص وه. دا د میت رامني له بارک اوباما يو قوي برياليتوب وړاندوينه کوي. یو ځل بیا، دا د د خامو، بوختوکارګرانو غیر احتمال نمونې د خطر یو بل مثال دی او د ادبي Digest رسوايې رسيدې.

3.4 شکل: د وانګ et al ځواب وا د. (2015). ځکه چې ځواب څخه XBox استخدام شوي دي، هغوی ډیر احتمال ځوان او زيات احتمال لري چې د 2012 کال د ټاکنو په نارينه، خپلوان ورکوونکو ته وي.

3.4 شکل: په ځواب وا د Wang et al. (2015) . ځکه چې ځواب څخه XBox استخدام شوي دي، هغوی ډیر احتمال ځوان او زيات احتمال لري چې د 2012 کال د ټاکنو په نارينه، خپلوان ورکوونکو ته وي.

خو، وانګ او همکارانو د دې ستونزې خبر دي او هڅه وکړه چې د ځواب ورکوونکو د وزن د نمونې د پروسې لپاره حل کړي. په ځانګړې توګه، دوی د-طبقه وروسته زه په اړه تاسو ته وويل چې د يو عصري ډول کارول. د یادونې وړ ده يو خپل روش په اړه څه زده کړې ځکه چې دا جوړوي-طبقه وروسته په اړه intuition، او همدارنګه ځانګړي نسخه وانګ او همکارانو لپاره کارول کيږي د وزن کولو غیر احتمال نمونې تر ټولو په زړه پورې طریقې یو.

زموږ په ساده مثال په 3.4.1 برخه بې کارۍ د اټکل په اړه، موږ د خلکو په ګروپونو پر بنسټ د استوګنې د دولت وېشل. برعکس، وانګ او همکارانو ته په 176.256 ډلو تعریف له خوا د خلکو ویشل: د جندر (2 کتګوریو کې)، نژاد (4 کتګوریو کې)، عمر (4 کتګوریو کې)، پوهنې (4 کتګوریو کې)، دولت (51 کتګوریو کې)، د ګوند ID (3 کتګوریو کې)، ايډيالوژۍ (3 کتګوریو کې) او 2008 رايې (3 کتګوریو کې). سره د ډیرو ګروپونو، د څېړونکو هیله کېږي چې دا به په زياتيدونکي احتمال لري چې له هرې ډلې په چوکاټ کې، په ځواب کې د تمایل د سره د اوباما ملاتړ uncorrelated و شي. بل، پرتله په انفرادي کچه د وزن د جوړولو، په توګه موږ په خپلو مثال وکړل، وانګ او همکارانو یوه پیچلې موډل چې په هر ګروپ چې به د اوباما د رايې ورکولو د هغو خلکو تناسب اټکل کارول. په پای کې، هغوی له دغو سره د هرې ډلې په نامه اندازه ملاتړ ډلې اټکل ګډ د ملاتړ د يو اټکل عمومي کچه تولید کړي. په بل عبارت، دوی د خلکو په لکیو پورې د بېلابېلو ډلو، په هر ګروپ لپاره د اوباما په مرسته اټکل شوی، او بيا د وزن په منځني ډول د دې ډلې اټکل ونيو چې د یوه ټولیز اټکل توليدوي.

په دې توګه، په خپل روش د ستره ستونزه ده چې د دې 176.256 ډلو هر لپاره د اوباما په مرسته اټکل. که څه هم د هغوی له ويناوالو 345.858 بې ساری ګډون، د ټاکنو د رايې ورکولو د معیارونو له خوا د ستر شمیر شامل، څو، څو ډلو د کوم لپاره چې وانګ او همکارانو تقریبا هیڅ ځواب کړې وې. له دې امله، چې په هر ګروپ دوی یو تخنیک کارول سره-طبقه وروسته واړخیزه regression په نوم، چې د څېړونکو affectionately غږ ښاغلی P. په بنسټيز ډول، د یوه ځانګړې ډلې په چوکاټ کې د اوباما ملاتړ اټکل، ښاغلی P. ډنډونه له ډیرو معلوماتو په مرسته اټکل نږدې اړوند ډلو. د مثال په توګه، د ښځينه، تقاعدیان په منځ کې د اوباما د ملاتړ د اټکل په اړه پاملرنه، 18-29 کالو ترمنځ عمر، چې کالج فارغانو، چې راجستر دي دیموکراتان، چې منځلاري ځان په ګوته کړي، او څوک چې په 2008. لپاره د اوباما رايه دا يو ډېر، ډېر ځانګړې ډلې، او دا ممکنه ده چې شتون لري له دغو ځانګړتياوو نمونه هيڅوک. له همدې امله، د دې ډلې په اړه اټکل وکړي، ښاغلي P. ډنډونه په ګډه څخه په ډير ورته ډلو د خلکو د اټکل.

دغه تحليل ستراتيژۍ په کارولو سره، وانګ او همکارانو کولای شول چې د XBox غیر احتمال نمونه په کارولو په بشپړ ملاتړ، چې اوباما د 2012 کال د ټاکنو په تر لاسه ډېر نژدې اټکل (انځور 3.5). په حقیقت کې د هغوی له مخې د خلکو د نظر ټاکنې يو مجموعي ډیر دقیق وو. په دې توګه، په دې صورت کې، د وزن-په ځانګړې توګه د ښاغلي P.-ښکاري ته ښه دنده په غیر احتمال معلوماتو د تعصب اصلاح؛ مهرداد چې د ليدو وړ کله چې تاسو په بوختوکارګرانو Xbox د معلوماتو څخه د اټکل له مخې وګورو.

انځور 3.5 د: له وانګ et al اټکلونه. (2015). د بوختوکارګرانو XBox نمونه ناسم اټکل توليديږي. خو، د وزن XBox نمونه اټکل کړې ده چې د احتمال په اساس د تليفون سروې په اوسط ډول ډیر دقیق وو توليديږي.

انځور 3.5 د: اټکل د Wang et al. (2015) . د بوختوکارګرانو XBox نمونه ناسم اټکل توليديږي. خو، د وزن XBox نمونه اټکل کړې ده چې د احتمال په اساس د تليفون سروې په اوسط ډول ډیر دقیق وو توليديږي.

د وانګ او همکارانو د مطالعې څخه دوه اساسي درسونه موجود دي. لومړی، د بوختوکارګرانو غیر احتمال نمونې کولای شي د بدو اټکلونو سبب؛ دا يو لوست چې ډېر څېړونکي مخکې اورېدلي. خو د دویم لوست دا دی چې غیر احتمال نمونې، کله چې په سمه توګه وزن، کولای شي په حقيقت کې خورا ښه اټکل توليدوي. په حقیقت کې، د دوی د اټکل له pollster.com، د نورو دوديزو ټاکنو ټاکنې يو په لحاظ د اټکل په پرتله زيات دقيق دي.

په پای کې، موجود دي چې هغه څه چې موږ کولای شو له دې ځانګړو مطالعه زده مهم محدوديتونه. يوازې له دې امله-طبقه وروسته په دې ځانګړې موضوع د ښه کار وکړ، هلته ضمانت نشته چې دا به په نورو مواردو کې ښه کار وکړي. په حقیقت کې، په ټاکنو کې ښايي د ټولو اسانه امستنې یو ځکه چې نظر ارزونو لپاره د نژدې 100 کلونو په ټاکنو کې زده شوي دي، په منظم ډول نظريات (موږ ګورو چې ټاکنې څوک ګټي)، او د ګوندونو تشخيص شتون لري او د نفوسو د ځانګړتیاوی عبارت دی د ټاکنو نسبتا predictive. په دې وخت کې موږ د جامدو نظري او تجربوي تجربې چې پوه شي کله چې د غیر احتمال نمونې د وزن تعديل به په کافی اندازه دقیق اټکل له توليد نه لري. هغه څه چې څرګند وي، خو که تاسو دې ته مجبور سره غیر احتمال نمونې کار وکړي، نو ده قوي دلیل به باور وشي چې تعدیل اټکل به په پرتله غیر عیار اټکل ښه شي.