3.4.2 نمونه های غیر احتمال: وزن

این ترجمه توسط یک کامپیوتر ساخته شده است. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 نمونه های غیر احتمال: وزن

با نمونه های غیر احتمال، وزن می توانید با تحریف ناشی از فرایند نمونه فرض را لغو کنید.

در راه همان است که محققان وزن پاسخ از نمونه احتمال، آنها همچنین می توانند پاسخ از نمونه های غیر احتمال وزن است. به عنوان مثال، به عنوان یک جایگزین برای CPS، تصور کنید که شما تبلیغات بنر در هزاران وب سایت قرار داده شده برای جذب شرکت کنندگان برای بررسی به منظور برآورد نرخ بیکاری است. به طور طبیعی، به شما خواهد بود شک و تردید که میانگین ساده از نمونه شما خواهد بود یک برآورد خوب از نرخ بیکاری است. شک و تردید شما این است که احتمالا به دلیل شما فکر می کنم که برخی از مردم به احتمال زیاد به تکمیل بررسی خود از دیگران است. به عنوان مثال، افرادی که زمان زیادی را در وب صرف نیست، کمتر به تکمیل بررسی خود.

همانطور که ما در آخرین بخش را دیدم، با این حال، اگر ما می دانیم که چگونه نمونه انتخاب به عنوان شد ما با احتمال انجام نمونه-پس ما می توانیم با تحریف ناشی از فرایند نمونه برداری را لغو کنید. متاسفانه، در هنگام کار با نمونه های غیر احتمال، ما نمی دانیم که چگونه نمونه انتخاب شد. اما، ما می توانیم فرض در مورد فرایند نمونه برداری و پس از آن اعمال می شود وزن در به همان شیوه. اگر این فرضیات درست باشد، پس وزن را به تحریف ناشی از فرایند نمونه برداری را لغو کنید.

به عنوان مثال، تصور کنید که در پاسخ به تبلیغات بنر خود را، شما 100،000 پاسخ دهندگان به خدمت گرفتند. با این حال، شما باور نمی کنم که این 100.000 پاسخ دهندگان یک نمونه تصادفی ساده از بزرگسالان آمریکایی هستند. در واقع، هنگامی که شما پاسخ دهندگان خود را نسبت به جمعیت ایالات متحده، شما را پیدا است که مردم از برخی از کشورهای (به عنوان مثال، نیویورک) بیش از حد مطرح و مردم را از برخی از کشورهای (به عنوان مثال، آلاسکا) هستند زیر نشان هستند. به این ترتیب، نرخ بیکاری از نمونه خود را به احتمال زیاد به یک برآورد بد از نرخ بیکاری در جمعیت هدف.

یکی از راه های به خنثیسازی اعوجاج است که در فرایند نمونه برداری اتفاق افتاده است به تخصیص وزن به هر فرد؛ وزن پایین تر به مردم از کشورهایی که بیش از حد مطرح در نمونه (به عنوان مثال، نیویورک) و وزن بالاتر به مردم از کشورهایی که زیر ارائه شده در نمونه (به عنوان مثال، آلاسکا). بیشتر به طور خاص، وزن برای هر مخاطب به رواج آنها در نسبی نمونه خود را مربوط به شیوع آنها در جمعیت ایالات متحده. این روش وزن است که به نام پس از طبقه بندی، و این ایده از وزن باید به شما به عنوان مثال در بخش 3.4.1 یادآوری که در آن پاسخ دهندگان از رود آیلند وزن کمتر از پاسخ دهندگان از کالیفرنیا داده شد. پس از طبقه بندی مستلزم آن است که شما می دانید به اندازه کافی برای قرار دادن پاسخ دهندگان خود را به گروه و به نسبت جمعیت هدف در هر گروه.

اگر چه وزن نمونه احتمالی و از نمونه غیر احتمال می ریاضی همان (ضمیمه فنی را ببینید)، آنها به خوبی در موقعیت های مختلف کار می کنند. اگر محقق شده است یک نمونه احتمال مناسب (به عنوان مثال، بدون خطا پوشش و عدم پاسخ)، پس از وزن برآورد نااریب برای تمام صفات در تمام موارد تولید کند. این تضمین نظری قوی است که چرا طرفداران نمونه احتمال پیدا کردن آنها را بسیار جذاب. از سوی دیگر، نمونه های غیر احتمال وزن تنها تولید برآورد نااریب برای تمام صفات اگر تمایل پاسخ برای همه یکسان در هر گروه هستند. به عبارت دیگر، به فکر بازگشت به عنوان مثال، با استفاده از پس از طبقه بندی برآورد بی طرفانه تولید اگر همه در نیویورک است، همان احتمال شرکت و هر کس در آلاسکا است، همان احتمال شرکت و غیره. این فرض است که به نام فرض همگن پاسخ-تمایل-در-گروه، و آن نقش کلیدی در شناخت ایفا می کند اگر پس از طبقه بندی به خوبی با نمونه های غیر احتمال کار خواهد کرد.

متاسفانه، در مثال ما، فرض همگن پاسخ-تمایل-در-گروه بعید است که درست به نظر می رسد. است که، آن بعید به نظر میرسد که هر کس در آلاسکا است، همان احتمال بودن در بررسی خود را. اما، سه امتیاز مهم به خاطر داشته باشید در مورد پس از طبقه بندی، که همه آن را به نظر می رسد بیشتر امیدوار است.

اول، همگن پاسخ-تمایل-در-گروه فرض قابل قبول تر به عنوان تعدادی از گروه های افزایش می یابد. و، محققان در حال به گروه فقط در یک بعد جغرافیایی تنها بر اساس محدود نمی شود. به عنوان مثال، ما می تواند بر اساس گروه دولت، سن، جنس، سطح تحصیلات و ایجاد کنید. به نظر می رسد قابل قبول تر است که تمایل پاسخ همگن در گروه 18-29 وجود دارد، فارغ التحصیلان زن، کالج زندگی در آلاسکا از درون گروه از همه مردم زندگی در آلاسکا. بنابراین، به عنوان تعدادی از گروه های مورد استفاده برای پس از طبقه بندی را افزایش می دهد، فرض مورد نیاز برای پشتیبانی آن را تبدیل معقول تر است. با توجه به این واقعیت، به نظر می رسد مثل یک محققان می خواهید برای ایجاد تعداد زیادی از گروه ها برای پس از طبقه بندی. sparsity داده: اما، به عنوان تعدادی از گروه های را افزایش می دهد، محققان به یک مشکل مختلف اجرا شود. اگر تنها تعداد کمی از مردم در هر گروه وجود دارد، پس از آن برآورد می شود نامطمئن تر، و در حالت افراطی است که در آن گروه است که هیچ پاسخ دهندگان وجود دارد، پس بعد از طبقه بندی به طور کامل شکسته. دو راه برای خروج از این تنش ذاتی میان معقولیت homogeneous- پاسخ-گرایش-در-گروه فرض و تقاضا برای اندازه نمونه مناسب در هر گروه وجود دارد. یکی از این روش این است که حرکت به یک مدل آماری پیچیده تر برای محاسبه وزن و از سوی دیگر است که جمع آوری یک بزرگتر، نمونه متنوع تر، کمک می کند که اطمینان اندازه نمونه مناسب در هر گروه. و گاهی اوقات محققان هر دو را انجام دهد، به عنوان من جزئیات بیشتر در زیر شرح در.

مورد دوم، در هنگام کار با پس از طبقه بندی شده از نمونه های غیر احتمال این است که این فرض همگن پاسخ-گرایش-در-گروه در حال حاضر در اغلب ساخته شده هنگام تجزیه و تحلیل نمونه احتمال. به این دلیل که این فرض برای نمونه احتمال در عمل مورد نیاز است این است که نمونه احتمال دارند عدم پاسخ، و رایج ترین روش برای تنظیم برای عدم پاسخ پس از طبقه بندی است که در بالا توضیح. البته، فقط به خاطر اینکه بسیاری از محققان را یک فرض خاصی به این معنا نیست که شما باید آن را انجام دهد. اما، به این معنا که هنگام مقایسه نمونه های غیر احتمال به نمونه احتمال در عمل، ما باید در نظر داشته باشید که هر دو در مفروضات و اطلاعات کمکی به منظور تولید برآورد بستگی دارد نگه دارید. در تنظیمات واقع بینانه ترین، هیچ روش بدون فرض به استنتاج وجود دارد.

در نهایت، اگر شما در مورد یک تخمین در مراقبت های ویژه در مثال بیکاری ما را ارزیابی و سپس شما نیاز به یک شرط ضعیف تر از همگن پاسخ-گرایش-در-گروه فرض. به طور خاص، شما لازم نیست که فرض کنیم که هر کس تمایل همان پاسخ، شما فقط نیاز به فرض این است که هیچ ارتباط بین گرایش پاسخ و نرخ بیکاری در هر گروه وجود دارد. البته، حتی این وضعیت ضعیف نمی خواهد در برخی شرایط نگه دارید. برای مثال، تصور برآورد نسبت آمریکایی که انجام کار داوطلبانه. اگر افرادی که کار داوطلبانه انجام هستند احتمال بیشتری برای دیدن همه موارد به در یک بررسی، و سپس محققان سیستماتیک بیش از برآورد مقدار داوطلبانه، حتی اگر آنها انجام تنظیمات پس از طبقه بندی، نتیجهای که به طور تجربی توسط نشان داده شده است Abraham, Helms, and Presser (2009) .

همانطور که قبلا گفتم، نمونه های غیر احتمال با شک و تردید بزرگ توسط دانشمندان علوم اجتماعی به دلیل نقش آنها در برخی از شکست شرم آور ترین در روزهای اولیه از تحقیق پیمایشی مشاهده، در بخش. یک مثال روشن از ما تا چه حد با نمونه غیر احتمال آمده تحقیقات وی وانگ، دیوید روچیلد، شاراد GOEL، و اندرو Gelman که به درستی نتیجه انتخابات سال 2012 آمریکا بهبود با استفاده از یک نمونه غیر احتمال از کاربران ایکس باکس آمریکایی است -a نمونه قطعا غیر تصادفی از آمریکایی ها (Wang et al. 2015) . محققان پاسخ دهندگان از سیستم بازی ایکس باکس استخدام، و به عنوان شما ممکن است انتظار، نمونه ایکس باکس مرد اریب و اریب جوان: 18 - کودکان 29 سال 19 درصد از رای دهندگان اما 65 درصد از نمونه ایکس باکس را تشکیل می دهند و مردان 47٪ را تشکیل می دهند از رای دهندگان و 93 درصد از نمونه ایکس باکس (شکل 3.4). از آنجا که از این تعصبات جمعیتی قوی، داده های خام ایکس باکس یک شاخص ضعیف از انتخابات بود. پیش بینی یک پیروزی قوی برای میت رامنی بیش از باراک اوباما است. باز هم، این یک مثال دیگر از خطرات ناشی از خام، نمونه های غیر احتمال تعدیل نشده است و یادآور شکست ادبی هضم است.

شکل 3.4: جمعیت از پاسخ دهندگان در Wang و همکاران (2015). از آنجا که پاسخ دهندگان از ایکس باکس انتخاب شدند، آنها به احتمال زیاد به جوان و بیشتر احتمال دارد به مرد، نسبت به رای دهندگان در انتخابات سال 2012 بود.

شکل 3.4: جمعیت از پاسخ دهندگان در Wang et al. (2015) . از آنجا که پاسخ دهندگان از ایکس باکس انتخاب شدند، آنها به احتمال زیاد به جوان و بیشتر احتمال دارد به مرد، نسبت به رای دهندگان در انتخابات سال 2012 بود.

با این حال، وانگ و همکارانش از این مشکلات آگاه بودند و اقدام به وزن از پاسخ دهندگان برای اصلاح فرایند نمونه برداری. به طور خاص، آنها یک شکل پیچیده تر از پس از طبقه بندی که به ات گفتم استفاده می شود. آن را به ارزش یادگیری کمی بیشتر در مورد رویکرد خود را به دلیل آن را می سازد در مورد شهود پس از طبقه بندی است، و نسخه خاص وانگ و همکارانش با استفاده از یکی از روش های هیجان انگیز ترین نمونه های غیر احتمال وزن است.

در مثال ساده ما در مورد برآورد بیکاری در بخش 3.4.1، ما جمعیت به دو گروه تقسیم بر اساس دولت محل اقامت. در مقابل، وانگ و همکارانش جمعیت به به 176،256 گروه های تعریف شده توسط تقسیم می شوند: جنسیت (2 دسته)، نژاد (4 دسته)، سن (4 دسته)، آموزش (4 دسته)، دولت (51 عناوین)، ID مهمانی (3 دسته)، ایدئولوژی (3 دسته) و 2008 رای (3 دسته). با گروه های تر، محققان امیدوار بودند که این امر می تواند به طور فزاینده احتمال وجود دارد که در داخل هر گروه، تمایل پاسخ ناهمبسته با پشتیبانی از اوباما بود. در مرحله بعد، به جای ساخت وزن در سطح فردی، به عنوان ما در مثال ما، وانگ و همکارانش با استفاده از یک مدل پیچیده به منظور برآورد نسبت افراد در هر گروه که به اوباما رای. در نهایت، آنها این تخمین گروه پشتیبانی با اندازه شناخته شده از هر گروه ترکیب برای تولید یک سطح کلی برآورد پشتیبانی می کند. به عبارت دیگر، آنها خرد شده تا جمعیت به گروه های مختلف، پشتیبانی از اوباما در هر گروه برآورد شده و سپس در زمان میانگین وزنی تخمین گروه برای تولید یک برآورد کلی.

بنابراین، چالش بزرگ در رویکرد خود را برآورد حمایت از اوباما در هر یک از این گروه های 176256. اگرچه پنل خود شامل 345،858 شرکت کنندگان منحصر به فرد، تعداد زیادی با استانداردهای رای گیری انتخابات، بسیاری از، بسیاری از گروه های که وانگ و همکارانش تقریبا هیچ پاسخ دهندگان به حال وجود دارد. بنابراین، به منظور برآورد پشتیبانی در هر گروه از آنها روش مورد استفاده به نام رگرسیون چند سطحی با پس از طبقه بندی، که محققان محبت آقای P. پاسخ اساسا، به منظور برآورد حمایت از اوباما در یک گروه خاص، آقای P. استخر اطلاعات از بسیاری از نزدیک گروه های مربوطه به عنوان مثال، در نظر گرفتن چالش برآورد حمایت از اوباما در میان هیسپانیک زن، بین 18-29 ساله، که فارغ التحصیلان کالج، که به دموکرات، که خود به عنوان میانه رو هستند، و کسی که برای اوباما در سال 2008. این رای داده یک گروه بسیار، بسیار خاص است، و ممکن است است که هیچ کس در نمونه با این ویژگی وجود دارد. بنابراین، برای برآورد در مورد این گروه، آقای ص استخر با هم از مردم در گروه های بسیار مشابه تخمین می زند.

با استفاده از این استراتژی تجزیه و تحلیل، وانگ و همکارانش قادر به استفاده از نمونه غیر احتمال ایکس باکس به بسیار نزدیک برآورد پشتیبانی به طور کلی که اوباما در انتخابات سال 2012 دریافت کرد (شکل 3.5). در واقع تخمین خود را دقیق تر از یک کل از افکار عمومی مردم بود. بنابراین، در این مورد، وزن به طور خاص آقای ص-به نظر می رسد انجام یک کار خوب تصحیح خطاها در داده های غیر احتمال؛ تعصبات که قابل مشاهده هستند زمانی که شما در برآورد از داده ایکس باکس تعدیل نشده است.

شکل 3.5: برآورد از وانگ و همکاران (2015). نمونه ایکس باکس تعدیل نشده تولید برآورد نادرست است. اما، نمونه ایکس باکس وزن برآورد که دقیق تر از متوسط نظرسنجی تلفنی مبتنی بر احتمال بودند.

شکل 3.5: برآورد از Wang et al. (2015) . نمونه ایکس باکس تعدیل نشده تولید برآورد نادرست است. اما، نمونه ایکس باکس وزن برآورد که دقیق تر از متوسط نظرسنجی تلفنی مبتنی بر احتمال بودند.

دو درس اصلی از مطالعه وانگ و همکارانش وجود دارد. اول، نمونه های غیر احتمال تعدیل نشده می توانید به برآوردهای بد منجر شود. این درسی است که بسیاری از محققان قبل از شنیده است. با این حال، درس دوم این است که نمونه های غیر احتمال، هنگامی که به درستی وزن، در واقع می تواند تخمین کاملا خوب است. در واقع، تخمین خود را دقیق تر از برآورد از pollster.com، تجمع بیش نظرسنجی های انتخاباتی سنتی بودند.

در نهایت، محدودیت های مهم به آنچه که ما می توانید از این یک مطالعه خاص یادگیری وجود دارد. فقط به خاطر اینکه بعد از طبقه بندی به خوبی در این مورد خاص کار می کرد، هیچ تضمینی وجود ندارد که آن را به خوبی در موارد دیگر کار می کنند وجود دارد. در واقع، انتخابات شاید یکی از ساده ترین تنظیمات به دلیل نظرسنجی شده اند مطالعه انتخابات برای تقریبا 100 سال است، بازخورد منظم (به ما می توانید ببینید کسی برنده انتخابات)، و شناسایی حزب وجود دارد و ویژگی های جمعیت شناختی نسبتا پیش بینی از رای گیری می باشد. در این نقطه، ما فاقد نظریه جامد و تجربه تجربی به زمانی که وزن تنظیمات به نمونه های غیر احتمال برآورد اندازه کافی دقیق تولید کند. یکی از چیزهایی است که روشن است، با این حال، اگر شما مجبور به کار با نمونه های غیر احتمال، پس از آن دلیل بسیار قوی بر این باور است که برآورد تنظیم بهتر از برآوردهای غیر تنظیم می شود وجود دارد.