رياضياتي نوٽس

هن ضمير ۾، آئون ڪجهه بابن مان ٿورڙي وڌيڪ رياضياتي شڪل ۾ ڪجهه خيال بيان ڪندس. هتي مقصد اهو آهي ته توهان سروي ۽ رياضياتي فريم ورڪ سان سروي جي تحقيق ڪندڙن طرفان آرام سان سهڪار حاصل ڪرڻ ۾ مدد ڪري رهيا آهيو انهي ڪري ته توهان انهن موضوعن تي لکيل وڌيڪ ٽيڪنالاجي مواد تي منتقلي ڪري سگهو ٿا. آئون امڪاني نموني متعارف ڪرائڻ جي شروعات ڪندس، پوء امڪاني نموني سان غير مشهوري سان هلن، ۽ آخرڪار، غير امڪاني نموني.

امڪاني نموني

هڪ هلندڙ مثال طور، اچو ته امريڪا ۾ بيروزگاري جي شرح جي اندازي جو مقصد سمجهي ٿو. هليو \(U = \{1, \ldots, k, \ldots, N\}\) ھدف آبادي جي آبادي آھن ۽ \(y_k\) \(k\) جي شخص جي لاء نتيجن جي ڪيفيت جي قيمت جي اجازت ڏيو. هن مثال ۾ \(y_k\) اهو آهي ته انسان \(k\) بيروزگار آهي. آخرڪار، هلون ٿا \(F = \{1, \ldots, k, \ldots, N\}\) فريم آبادي آھن، جنھن جي سادگي لاء ھدف آبادي جي آبادي جيترو آھي.

هڪ بنيادي نموني ڊيزائن کي بغير نموني متبادل نموني سان متبادل آهي. انهي حالت ۾، هر ماڻهو جي نموني ۾ شامل ٿيڻ جي امڪاني طور تي شامل هوندي آهي. نمونہ \(s = \{1, \ldots, i, \ldots, n\}\) . جڏهن هي نموني نموني سان گڏ گڏ ڪيل ڊيٽا گڏ ڪيا وڃن ٿا، هڪ محقق انهن نموني سان آبادي بيروزگاري جي شرح جو اندازو ڪري سگهي ٿو:

\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]

جتي \(\bar{y}\) آبادي ۾ بيروزگاري جي شرح آھي ۽ \(\hat{\bar{y}}\) بيروزگاري جي شرح جو اندازو آھي (يعني \(\hat{ }\) عام طور تي آھي ڪاٿوٽ ڪندڙ کي ظاهر ڪرڻ لاء استعمال ڪيو ويو آهي.

حقيقت ۾، محقق ڪڏهن به متبادل بي ترتيب نموني استعمال ڪرڻ کانسواء بغير بدران استعمال ڪن ٿا. مختلف سببن لاء (مان هڪ مان هڪ لمحو ۾ بيان ڪندس)، محقق اڪثر ڪري نموني ٺاهيل نموني سان شامل ٿيڻ جي شامل ڪيون آهن. مثال طور، محقق کي ڪيليفورنيا ۾ ماڻهن جي ڀيٽ ۾ وڌيڪ احتمال شامل ڪرڻ سان گڏ فلوريڊا ۾ ماڻهن کي چونڊيو وڃي ٿو. انهي صورت ۾، نموني معني (ايڪ 3.1، 3.1) سٺو ڄاڻڻ وارو نه هوندا. ان جي بدران، اڻڄاتل امڪانات شامل ٿيڻ کان پوء، محقق استعمال ڪندا آهن

\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]

جتي \(\hat{\bar{y}}\) بيروزگاري جي شرح جو اندازو آھي ۽ \(\pi_i\) شخص آھي \(i\) شامل ٿيڻ جي امڪان آھي. هيٺين طريقي سان، آئون ايسٽيمرٽر کي ايق ۾ سڏيندو آهيان. 3.22 افريسٽ-تھامسنسن جي امڪانيٽر. Horvitz-Thompson estimator انتهائي مفيد آهي ڇو ته اها ڪنهن به احتساب نموني جي ڊزائينز (Horvitz and Thompson 1952) اڻ ڄاڻائي اندازي جي ڪري ٿي. ڇاڪاڻ ته Horvitz-Thompson estimator ايتري ئي وقت اچي رهيو آهي، انهي کي مددگار ڪرڻ جو مددگار آهي ته جيئن ته ان کي ٻيهر ٻيهر لکجي وڃي.

\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]

جتي \(w_i = 1 / \pi_i\) . جيئن ته. 3.3 ظاهر آهي، Horvitz-Thompson estimator هڪ وزن وارو نمونو آهي، جتي اهو مطلب آهي ته وزن مخلص طور انتخاب جي احتساب سان لاڳاپيل آهي. ٻين لفظن ۾، گهٽ ۾ گهٽ ڪنهن شخص کي نموني ۾ شامل ڪيو وڃي ٿو، اهو وڌيڪ وزن جنهن شخص کي اندازي ۾ وٺڻ گهرجي.

جيئن بيان ڪيو ويو آهي، محقق اڪثر ڪري ماڻهن کي غير مساوي امڪانات شامل ڪرڻ جي نموني سان ٺهيل آهن. ھڪڙي ڊزائن جو ھڪڙو مثال جيڪو شامل ٿيڻ جي غير مساوي امڪان کي وڌائي سگھن ٿا نموني نموني آھي ، جنھن کي سمجھڻ ضروري آھي ڇو ته اھو ڄاڻايل طريقيڪار سان لاڳاپيل پوسٽ اسٽوريج آھي . stratified هوندا ۾، هڪ محقق ۾ ٽارگيٽ آبادي ڦاٽن \(H\) مھاڙ سچا ۽ حتمي گروپن. اهي ٽوليون سوراخ سڏيو ويندو آهي ۽ اهي ظاهر ڪيا ويندا آهن. \(U_1, \ldots, U_h, \ldots, U_H\) . هن مثال ۾، رياستون رياستون آهن. گروپن جي سائز کي ظاهر ڪيو ويو آهي \(N_1, \ldots, N_h, \ldots, N_H\) . هڪ محقق برادري نموني استعمال ڪرڻ چاهيندا ته انهي کي يقيني بڻائڻ لاء بيروزگاري جي رياستي سطح جي تخميني ٺاهڻ لاء هوء هر رياست ۾ ڪافي ماڻهو آهن.

ھڪڙي آبادي کي ھڪڙي سطح تي ورهايو ويو آھي، فرض ڪيو ويو ته محقق سائيز جي \(n_h\) واري ھڪڙي بي ترتيب جي نموني کي منتخب ڪندو \(n_h\) وڌيڪ، فرض ڪيو ته هر نموني ۾ چونڊيل هڪ جوابدار بڻجي ويندا آهن (آء توهان جي ايندڙ حصي ۾ غير رد نه ڪندس). انهي صورت ۾، شامل ٿيڻ جي امڪان آهي

\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]

ڇاڪاڻ ته اهي نموني نموني جي اندازي مطابق، انهن امڪانن کي هر شخص کان مختلف ٿي سگهن ٿا، تحقيق ڪندڙن کي هاروويز-تھامسنسن امڪانيٽر (ايق 3.2) استعمال ڪندي ان جي احتساب جي نتيجي ۾ هر جوابدار وزن جي ضرورت هوندي آهي.

جيتوڻيڪ Horvitz-Thompson تخمینہ غیر منصفانہ ہے، اگر محققین معاون معلومات سان نموني کي گڏ ڪندي وڌيڪ صحيح (يعني گهٽ ويريسي) تخمينو پيدا ڪري سگھي ٿو. ڪجهه ماڻهو اها حيران ٿي چڪي آهي ته اهو صحيح آهي جڏهن ته ممڪن آهي ته تڪليف ممڪن آهي. هنن طريقن سان معاون معلومات استعمال ڪندي خاص طور تي اهم آهن ڇو ته، آئون بعد ۾ ڏيکاريان ٿو، معاون معلومات احتساب نموني جي غير تخميني ۽ غير امڪاني نموني سان تخميني ڪرڻ جي لاء اهم آهي.

معاون معلومات استعمال ڪرڻ لاء هڪ عام ٽيڪنڪ پوسٽ اسٽائريشن آهي . مثال طور، تصور ڪريو ته محقق هر 50 رياستن ۾ مرد ۽ عورت جو تعداد معلوم ٿئي ٿو؛ اسان هنن گروپ جي سائز کي ظاهر ڪري سگھو ٿا جهڙوڪ \(N_1, N_2, \ldots, N_{100}\) . هن معاون معلومات کي نموني سان گڏ ڪرڻ لاء، محقق نموني نموني ۾ \(H\) (گروپن ۾ ورهائي سگهو ٿا \(H\) انهي معاملي ۾ 100)، هر گروپ جي اندازي مطابق، ۽ انهي گروپ جي وزن وارو اوسط ٺاهڻ جو مطلب آهي:

\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]

بالڪل، اي ايم ۾ ڄاڻڻ وارو. 3.5 وڌيڪ صحيح ٿي سگهي ٿو ڇاڪاڻ ته اها اڻ ڄاڻايل نموني چونڊجي ٿي ته اهو ڄاڻايل آبادي جي معلومات استعمال ڪري ٿي \(N_h\) صحيح صحيح آهي. انهي جي باري ۾ سوچڻ جو هڪ طريقو اهو آهي ته انهي جي پوزيشن انهي ڊيٽا کي گڏ ڪرڻ کان پوء تقريبن لڳاتار جي رفتار وانگر آهي.

آخر ۾، هن حصي ۾ ڪجهه نموني ٺاهيل ڊزائينز بيان ڪيو اٿس: ساده بي ترتيب نموني بغير متبادل، غير مساوات جي نموني سان نموني ۽ استحڪام نموني. اهو پڻ ٻن مکيه نظريات بابت اندازو پڻ بيان ڪيو آهي: هاروويز-تھامسنسن جي امڪانيٽر ۽ پوسٽ اسٽرائٽيشن. امڪان نموني نموني جي ڊزائينز جي وڌيڪ رسم الخط جي لاء، Särndal, Swensson, and Wretman (2003) باب 2 (ڏسو) ڏسو. سٿري نموني جي وڌيڪ رسمي ۽ مڪمل علاج لاء Särndal, Swensson, and Wretman (2003) سيڪشن 3.7 کي ڏسو Särndal, Swensson, and Wretman (2003) . Horvitz-Thompson estimator جي ملڪيت جي ٽيڪنالاجي وضاحت لاء، Overton and Stehman (1995) Horvitz and Thompson (1952) ، Overton and Stehman (1995) ، يا سيڪنڊ 2.8 s @ sarndal_model_2003 مان. پوسٽ ورهائڻ جي وڌيڪ رسمي علاج لاء، Holt and Smith (1979) ، Smith (1991) ، Little (1993) ، يا Särndal, Swensson, and Wretman (2003) مان سيڪشن 7.6 Särndal, Swensson, and Wretman (2003) .

امڪاني نموني غير تفسير سان

تقريبن سڀني حقيقي سروي ۾ ناڪاري؛ اهو آهي، نموني آبادي ۾ هرڪو نه هر سوال جو جواب. اتي ٻه مکيه قسم آهن بغير: شيون غير مشائده ۽ يونٽ غير منسٽر . شيون ۾ غير معقول، ڪجهه جواب ڏيڻ وارو ڪجهه شيون نه ڏيڻ جو جواب ڏيندا آهن (مثال طور، ڪڏهن ته ځواب ويونکي نه حساس سمجهيو سوالونه جو جواب نه ڏيڻ). يونٽ جي غير تفسير، جيڪي ماڻهو جيڪي نموني آبادي لاء چونڊيا ويا آهن انهن سروي ۾ جواب نه ٿا ڏين. يونٽ جي غير تفسير لاء ٻه عام سبب آهن ته نموني ٿيل شخص سان رابطو نٿو ڪري سگهجي ۽ نموني انسان سان رابطو ٿيو پر حصو وٺڻ کان انڪار ڪري ٿو. هن حصي ۾، آئون يونٽ جي غير منسٽر تي ڌيان ڏيندو. پڙهندڙن کي غير دلچسپي ڏيارڻ ۾ دلچسپي رکڻ گهرجي ننڍو ۽ روبين (2002) ڏسو.

محقق اڪثر اڪثر يونٽ غير ردعمل جي سروي بابت ڄاڻڻ بابت ٻن مرحلن جي نموني جي عمل جي باري ۾ سوچندا آهن. پهرين مرحلي ۾، سنڌ جي محقق جو هڪ نمونو selects \(s\) جيئن ته هر شخص شموليت جو هڪ ممڪن ڪئي \(\pi_i\) (جتي \(0 < \pi_i \leq 1\) ). وري، ٻئي مرحلي ۾، جيڪي نموني ۾ چونڊيا ويا آهن امڪاني طور تي \(\phi_i\) (جتي \(0 < \phi_i \leq 1\) ) سان. هي ٻه مرحلو پروسيجر جا جوابدارين جي آخري سيٽ ۾ نتيجا \(r\) . انهن ٻنهي مرحلن جي وچ ۾ هڪ اهم فرق اهو آهي ته محقق نموني چونڊڻ جي عمل کي ڪنٽرول ڪن ٿا، پر انهن تي ضابطو نه ڪن ته انهن نموني ماڻهن جا جوابدار بڻجي ويندا. انهن ٻنهي عملن کي گڏ ڪرڻ، امڪاني طور تي ڪو ماڻهو جواب ڏيڻ وارو هوندو

\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]

سادگي جي خاطر، مان سمجهان ٿو ته اصل نموني ڊيزائن سادي نموني جي بدران بغير نموني بدران. جيڪڏهن هڪ محقق سائيز جي نموني نموني چونڊيندي آهي \(n_s\) انهي جو \(n_r\) جواب ڏيڻ وارو، ۽ جيڪڏهن محقق غير جواب رد ڪري ۽ جواب ڏيڻ وارن جي معني استعمال ڪري ٿو، ته اندازي جي بنيادن تي مشتمل هوندي:

\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]

جتي \(cor(\phi, y)\) آبادي جي جواب جي نتيجن ۽ نتيجن جي وچ ۾ آبادي جو تعلق آھي (مثال طور، بيروزگاري جي حيثيت)، \(S(y)\) آبادي جو نتيجو آھي، ان جي نتيجي ۾ (مثال طور بيروزگاري ڪيفيت يافته)، \(S(\phi)\) آبادي جي جواب جي تڪليف جو معيار ويڪرائي آهي، ۽ \(\bar{\phi}\) آبادي جو مطلب آھي پروپوزل (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .

ايق. 3.7 مان ظاهر ٿئي ٿو ته اڻ رڪاوٽ تعصب جو تعارف نه ڪندو، جيڪڏهن هيٺيان شرطن مان ملي وڃن:

  • بيروزگاري جي ڪيفيت ۾ ڪا تبديلي ناهي. \((S(y) = 0)\) .
  • ان جي جواب ۾ واجبيات \((S(\phi) = 0)\) جواب ۾ ڪا تبديلي ناهي.
  • جواب جي تڪليف ۽ بيروزگاري جي صورتحال جي وچ ۾ ڪوبه باهمي تعلق نه آهي \((cor(\phi, y) = 0)\) .

بدقسمتي سان، انهن جي ڪنهن به حالتن جو امڪان نظر نه اچي. اهو محسوس ٿئي ٿو ته اتي روزگار جي حالت ۾ ڪابه تبديلي نه هوندي، يا ان جي جواب جي پيداوار ۾ ڪا تبديلي نه هوندي. ان ڪري، ايق ۾ بنيادي اصطلاح. 3.7 باهمي تعلق آھي: \(cor(\phi, y)\) . مثال طور، جيڪڏهن ماڻهو هوندا آهن ته بيروزگار وڌيڪ جواب ڏيڻ جا امڪان آهن، انهي جو اندازو لڳندي روزگار جي شرح اڳتي وڌايو ويندو.

جڏهن ته غير نفسيات جو اندازو لڳائڻ لاء چال معاشي معلومات استعمال ڪرڻ آهي. مثال طور، هڪ طريقو جنهن ۾ توهان معاون معلومات استعمال ڪري سگهو ٿا پوسٽ اسٽوريشن (مٿي کان مٿي يادداشت 3.5.). اهو ظاهر ٿئي ٿو ته پوسٽ-استحڪام آسٽيمٽر جي تعصب آهي:

\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]

جتي \(cor(\phi, y)^{(h)}\) ، \(S(y)^{(h)}\) ، \(S(\phi)^{(h)}\) ۽ \(\bar{\phi}^{(h)}\) مٿي بيان ڪيو ويو آھي پر گروپ جي ماڻھن تي محدود \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) . ان ڪري، مجموعي طور تي تعصب ننڍڙو ٿيندو جيڪڏهن هر پوسٽ ورهائڻ واري گروپ ۾ تعصب ننڍڙو آهي. هتي ٻه طريقا آهن جيڪي هر پوسٽ اسپيڪٽيشن گروپ ۾ بيعت کي ننڍڙي ٺاهڻ بابت سوچڻ پسند ڪن ٿا. پهريون، توهان جئين گروپن ٺاهڻ جي ڪوشش ڪرڻ چاهيندا آهن جتي جواب جي تڪليف ۾ ٿوري تبديلي ( \(S(\phi)^{(h)} \approx 0\) ) ۽ نتيجو ( \(S(y)^{(h)} \approx 0\) ). ٻيو ته توهان گروپن کي ٺاهيو جتي ماڻهو جيڪي توهان ڏسندا آهيو انهن وانگر اهي ماڻهو جهڙوڪ نه هجن ( \(cor(\phi, y)^{(h)} \approx 0\) ). ڳاڙهو eq. 3.7 ۽ eq. 3.8 مدد ڪري ٿي واضح ٿئي ٿو ته پوسٽ-استحقاق غير رد عمل جي طرفان باضابطه سبب گهٽائي سگھي ٿو.

آخر ۾، هن حصي ۾ امڪاني نموني جي نموني سان هڪ ردعمل مهيا ڪئي ۽ انهن تعصب کي ظاهر ڪيو آهي جيڪو غير منشي بغير پوسٽ اسپٽٽيٽمنٽ ايڊمنسٽريشن سان ۽ انهن ٻنهي کي متعارف ڪري سگهي ٿو. Bethlehem (1988) وڌيڪ عام نموني جي جوڙجڪ لاء غير تفسير جي سببن جي اشتقاق پيش ڪري ٿو. غير تفسير لاء ترتيب ڏيڻ لاء پوسٽ-استحڪام استعمال ڪرڻ تي وڌيڪ، Smith (1991) ۽ Gelman and Carlin (2002) ڏسو. پوسٽ-استحقاق هڪ وڌيڪ عام گهرايل جو حصو آهي جنهن جي تڪليف جي امڪانن کي ٽيڪنالاجي سڏيو وڃي ٿو، جهنگ (2000) هڪ مضمون جي ڊگهي علاج ۽ Särndal and Lundström (2005) ڪتاب جي ڊگهي علاج لاء. غير Kalton and Flores-Cervantes (2003) لاء ترتيب ڏيڻ لاء ٻين ٻين وزن جي طريقن تي وڌيڪ، Kalton and Flores-Cervantes (2003) ، Brick (2013) ، ۽ Särndal and Lundström (2005) .

غير امڪاني نموني

غير امڪاني نموني ۾ مختلف قسم جي ڊزائينز (Baker et al. 2013) . وانگ ۽ ساٿين طرفان (W. Wang et al. 2015) Xbox (W. Wang et al. 2015) پاران Xbox جي استعمال ڪندڙن جي نموني تي خاص طور تي خاص طور تي توجہ مرکوز، توهان هن نموني مان سوچيو ٿا جتي هڪ نموني ٺهيل جو اهم حصو نه آهي \(\pi_i\) ان جي نتيجي ۾ محقق ڪندڙن جي ڀڄڻ جي امڪاني هجي) پر \(\phi_i\) (جواب ڏيڻ وارن تي مبني طور تي ردعمل جو ڪارڻ). قدرتي طور تي، اهو مثالي ناهي ڇو ته \(\phi_i\) اڻڄاتل آهن. پر، وانگي ۽ همراهن جي طور تي، نموني نموني مان پڻ اهڙي نموني نموني کان به وڏي ڪوريج جي غلطي سان، وڏي تباهي جي ضرورت نه هجي ته محقق ان جي مسئلن جي حل ڪرڻ لاء سٺو معاون معلومات ۽ سٺو شمارياتي ماڊل آهي.

Bethlehem (2010) مٿين اشتهارن جي پوزيشن بابت پوزيشن بابت ڪيترن ئي غير مشهوري ۽ ڪوريج جي غلطي شامل ڪري ٿي. پوزيشن پوسٽ ڪرڻ کان علاوه، غير احتساب نموني سان ڪم ڪرڻ ۽ ٻين امڪاني نموني سان (Ansolabehere and Rivers 2013; ??? ) غير (Ansolabehere and Rivers 2013; ??? ) شامل نموني ملازمت (Ansolabehere and Rivers 2013; ??? ) ، پروپوزل स्कोर وزن (Lee 2006; Schonlau et al. 2009) ، ۽ حساب ڪتاب (Lee and Valliant 2009) . انهن طريقن جي وچ ۾ هڪ عام موضوع مددگار معلومات جو استعمال آهي.