3.4 نحوه پرسش

عصر دیجیتال نمونه گیری احتمالی را در عمل سخت تر می کند و فرصت های جدیدی را برای نمونه گیری غیر احتمالی ایجاد می کند.

در تاریخ نمونه برداری، دو روش رقابتی وجود دارد: روش نمونه گیری احتمالی و روش های نمونه گیری غیر احتمالی. اگرچه هر دو روش در روزهای اولیه نمونه گیری مورد استفاده قرار گرفت، نمونه گیری احتمالی به تسلط رسید، و بسیاری از محققان اجتماعی به بررسی نمونه گیری غیر احتمالی با شک و تردید زیادی پرداختند. با این حال، همانگونه که در زیر توضیح خواهم داد، تغییرات ایجاد شده توسط عصر دیجیتال به این معنی است که وقت آن رسیده است تا محققان نمونه برداری غیر احتمالی را مرور کنند. به طور خاص، نمونه گیری احتمالی در عمل سخت است و نمونه گیری غیر احتمالی سریع تر، ارزان تر و بهتر شده است. نظرسنجی سریع تر و ارزان تر فقط به خودی خود پایان نمی دهد: آنها فرصت های جدیدی مانند نظرسنجی های مکرر و حجم نمونه های بزرگ را فراهم می کنند. به عنوان مثال، با استفاده از روش های غیر احتمالی، مطالعه انتخابات کنگره تعاونی (CCES) می تواند تقریبا 10 برابر بیشتر از شرکت کنندگان در مطالعه های قبلی با استفاده از نمونه گیری احتمالی استفاده کند. این نمونه بسیار بزرگتر محققان سیاسی را قادر می سازد تا تغییرات نگرش و رفتار در زیر گروه ها و زمینه های اجتماعی را مطالعه کنند. علاوه بر این، تمام این مقیاس اضافه شده بدون کاهش کیفیت برآوردها (Ansolabehere and Rivers 2013) .

در حال حاضر رویکرد غالب برای نمونه برداری برای تحقیقات اجتماعی نمونه گیری احتمالی است . در نمونه گیری احتمالی، تمام اعضای جامعه هدف دارای یک احتمال شناخته شده و غیر صفر از نمونه برداری هستند و همه افرادی که نمونه برداری می شوند، به نظرسنجی پاسخ می دهند. هنگامی که این شرایط در حال برآورده شدن، نتایج ریاضی ظریف تضمین قابل اثبات در مورد توانایی محقق برای استفاده از نمونه برای ایجاد نتیجه گیری در مورد جمعیت هدف است.

با این حال، در دنیای واقعی، شرایطی که این نتایج ریاضی را پایه گذاری می کنند، به ندرت برآورده می شوند. به عنوان مثال، اغلب خطاهای پوشش و عدم پاسخ وجود دارد. به علت این مشکلات، محققان اغلب باید تعدادی از تنظیمات آماری را برای استخراج نتیجه از نمونه خود به جمعیت هدف خود استفاده کنند. بنابراین، مهم است که بین نمونه گیری احتمالی در نظریه ، که دارای تضمین های نظری قوی و نمونه گیری احتمالی در عمل است ، که چنین تضمین هایی را ارائه نمی دهد و بستگی به انواع مختلف تنظیمات آماری دارد، تمایز قائل می شود.

در طول زمان، تفاوت بین نمونه گیری احتمالی در نظریه و نمونه گیری احتمالی در عمل افزایش یافته است. به عنوان مثال، نرخ عدم پاسخ به طور پیوسته افزایش یافته است، حتی در نظرسنجی های با کیفیت بالا و گران (شکل 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) . نرخ های غیر پاسخ در نظرسنجی های تجاری تجاری بسیار گران تر است - گاهی اوقات حتی تا 90٪ (Kohut et al. 2012) . این افزایش در عدم پاسخ کیفیت تخمین ها را تهدید می کند، زیرا تخمین ها به طور فزاینده ای وابسته به مدل های آماری است که محققان برای تنظیم عدم پاسخ به آن استفاده می کنند. علاوه بر این، این کیفیت کاهش می یابد، علیرغم تلاش های گران قیمت توسط محققان تحقیق برای حفظ نرخ پاسخ بالا. بعضی از مردم می ترسند که این دوچندین روند کاهش کیفیت و افزایش هزینه ها، پایه و اساس تحقیقات تحقیقاتی (National Research Council 2013) تهدید می کند.

شکل 3.5: عدم پاسخ به طور فزاینده ای، حتی در نظرسنجی گران با کیفیت بالا (شورای پژوهشی ملی 2013؛ ب. D. مایر، مک و سالیوان، 2015)، به طور فزاینده ای ادامه دارد. نرخ های غیر پاسخ برای نظرسنجی های تجاری تجاری بسیار گران تر است، گاهی اوقات حتی تا 90٪ (Kohut et al 2012). این روند درازمدت در عدم پاسخ به این معنی است که جمع آوری داده ها گران تر است و تخمین ها کمتر قابل اعتماد هستند. شکل 1 از ب. دی. مایر، مک و سالیوان (2015) اقتباس شده است.

شکل 3.5: عدم پاسخ به طور فزاینده ای، حتی در نظرسنجی گران با کیفیت بالا (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) به طور فزاینده ای ادامه دارد. نرخ های غیر پاسخ برای نظرسنجی های تجاری تجاری بسیار گران تر است، گاهی اوقات حتی تا 90٪ (Kohut et al. 2012) . این روند درازمدت در عدم پاسخ به این معنی است که جمع آوری داده ها گران تر است و تخمین ها کمتر قابل اعتماد هستند. شکل 1 از BD Meyer, Mok, and Sullivan (2015) اقتباس شده است.

در عین حال که مشکلات روش نمونه گیری احتمالی رو به رشد است، پیشرفت های هیجان انگیز در روش های نمونه گیری غیر احتمالی وجود دارد . سبک های متفاوتی از روش های نمونه گیری غیر احتمالی وجود دارد، اما تنها چیزی که آنها مشترک دارند این است که آنها نمی توانند به راحتی در چارچوب ریاضی نمونه برداری احتمالی قرار بگیرند (Baker et al. 2013) . به عبارت دیگر، در روش های نمونه گیری غیر احتمالی، هیچ کس احتمال ورود و یا عدم شناخت را ندارد. روش های نمونه گیری غير احتمالی شهرت وحشتناکی در ميان محققان محيطی دارند و با برخی از غم انگيزترين نقاط ضعف محققان نظرسنجی، مانند سقوط ادبيات ادبي (که قبلا بحث شده است) و "ديويی شکست ترومن"، پيش بينی نادرست در مورد آمريکا انتخابات ریاست جمهوری در سال 1948 (شکل 3.6).

شکل 3: رئیس جمهور هری ترومن تاکید کرد که روزنامه ای که اشتباه خود را در مورد شکست خود اعلام کرده بود. این عنوان بر اساس تخمین های نمونه های غیر احتمالی (Mosteller 1949؛ Bean 1950؛ Freedman، Pisani، Purves 2007) بود. اگر چه دویید شکست ترومن در سال 1948 اتفاق افتاد، هنوز هم در میان دلیل است که برخی از محققان در مورد برآورد نمونه های غیر احتمالی شک و تردید دارند. منبع: کتابخانه و موزه هری اس. ترومن.

شکل 3: رئیس جمهور هری ترومن تاکید کرد که روزنامه ای که اشتباه خود را در مورد شکست خود اعلام کرده بود. این عنوان بر اساس تخمین های نمونه های غیر احتمالی (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) . اگر چه "دیوئی شکست ترومن" در سال 1948 اتفاق افتاد، هنوز هم در میان دلیل است که برخی از محققان در مورد برآورد نمونه های غیر احتمالی شک و تردید دارند. منبع: کتابخانه و موزه هری اس. ترومن .

یک نمونه از نمونه برداری غیر احتمالی که مخصوصا برای عصر دیجیتال مناسب است، استفاده از پانل های آنلاین است . محققان با استفاده از پانل های آنلاین به برخی ارائه دهندگان پانل، معمولا یک شرکت، دولت یا دانشگاه، بستگی دارند تا یک گروه وسیع و متنوعی را ایجاد کنند که موافقت کنند که به عنوان پاسخ دهندگان برای نظرسنجی ها شرکت کنند. این شرکت کنندگان پانک اغلب با استفاده از انواع متفاوتی از جمله آگهی های تبلیغاتی آنلاین استخدام می شوند. سپس، یک محقق می تواند ارائه دهنده پانل را برای دسترسی به نمونه ای از پاسخ دهندگان با ویژگی های مورد نظر (به عنوان مثال نماینده ملی بزرگسالان) پرداخت نماید. این پانل های آنلاین روش های غیر احتمالی هستند چرا که هیچ کس شناخته شده نیست، احتمال عدم وجود آن را دارد. اگر چه پانل های غیر آنلاین احتمالا توسط محققان اجتماعی (به عنوان مثال، CCES) مورد استفاده قرار می گیرند، هنوز بحث هایی در مورد کیفیت برآورد هایی که از آنها صورت می گیرد، وجود دارد (Callegaro et al. 2014) .

با وجود این بحث ها، من فکر می کنم دو دلیل وجود دارد که چرا زمان مناسب برای محققان اجتماعی برای بازبینی نمونه گیری غیر احتمالی وجود دارد. اول، در عصر دیجیتال، در جمع آوری و تجزیه و تحلیل نمونه های غیر احتمالی پیشرفت های زیادی صورت گرفته است. این روش های جدیدتر از روش هایی که باعث ایجاد مشکلات در گذشته می شوند، به اندازه کافی متفاوت هستند که من فکر می کنم آن را به عنوان "نمونه گیری غیر احتمالی 2.0" فکر می کنم. دومین دلیل که محققان باید نمونه گیری غیر احتمالی را بازبینی کنند این است که نمونه برداری احتمالی در تمرین به طور فزاینده ای مشکل می شود. هنگامی که نرخ بالای پاسخ غیر واکنش وجود دارد - همانطور که در حال حاضر در نظرسنجی های واقعی وجود دارد - احتمال واقعی ثبت برای پاسخ دهندگان شناخته شده نیست، و بنابراین نمونه های احتمالی و نمونه های غیر احتمالی به همان اندازه که بسیاری از محققان معتقد نیستند، متفاوت نیستند.

همانطور که قبلا گفتم، نمونه های غیر احتمالی توسط بسیاری از محققان اجتماعی، به دلیل نقش خود در برخی از شکست های خجالت آور در روزهای اولیه تحقیقات تحقیق، با بسیاری از محققان اجتماعی مواجه شده اند. یک نمونه واضح از اینکه چگونه با نمونه های غیر احتمالی روبرو شده ایم، تحقیق توسط Wei Wang، David Rothschild، Sharad Goel و Andrew Gelman (2015) که به درستی نتیجه انتخابات سال 2012 ایالات متحده را با استفاده از نمونه غیر احتمالی کاربران آمریکایی ایکس باکس - یک نمونه کاملا تصادفی آمریکایی است. محققان پاسخ دهندگان از سیستم بازی XBox را استخدام کردند و همانطور که انتظار داشتند، نمونه ایکس باکس مرد و ناهموار جوان بود: 18 تا 29 ساله 19٪ از رای دهندگان را تشکیل می دهند، اما 65٪ نمونه ایکس باکس و مردان 47٪ از رای دهندگان را تشکیل می دهد، اما 93٪ نمونه ایکس باکس (شکل 3.7). به دلیل این تغییرات جمعیتی شدید، داده های خام ایکس باکس شاخص ضعیف بازده انتخابات بود. این پیش بینی پیروزی قوی برای میت رامنی بر باراک اوباما را پیش بینی کرد. باز هم، این یکی دیگر از خطرات نمونه های غیر احتمالی خام و غیرقابل اصلاح است و یادآور شکست ناپذیر ادبی است .

شکل 3.7: جمعیت شناسی پاسخ دهندگان در W. Wang و همکاران. (2015). از آنجایی که پاسخ دهندگان از XBox استخدام شده بودند، احتمال بیشتری داشتند که جوان باشند و بیشتر احتمال دارد که مرد باشند، نسبت به رای دهندگان در انتخابات 2012. از W. Wang و همکاران اقتباس شده است. (2015)، شکل 1.

شکل 3.7: جمعیت شناسی پاسخ دهندگان در W. Wang et al. (2015) . از آنجایی که پاسخ دهندگان از XBox استخدام شده بودند، احتمال بیشتری داشتند که جوان باشند و بیشتر احتمال دارد که مرد باشند، نسبت به رای دهندگان در انتخابات 2012. از W. Wang et al. (2015) اقتباس شده W. Wang et al. (2015) ، شکل 1.

با این حال، وانگ و همکاران از این مشکلات آگاهی داشتند و در هنگام برآوردن تلاش برای تنظیم فرایند نمونه گیری غیر تصادفی خود را تنظیم کردند. به طور خاص، آنها پس از طبقه بندی ، یک روش است که به طور گسترده ای برای تنظیم نمونه های احتمالی که دارای خطاهای پوشش و عدم پاسخ هستند، استفاده می شود.

ایده اصلی پس از طبقه بندی، استفاده از اطلاعات کمکی در مورد جمعیت هدف برای کمک به بهبود برآوردی است که از یک نمونه استفاده می شود. وانگ و همکارانش هنگام استفاده از طبقه بندي پس از تخمين از نمونه غير احتمالي خود، گروه را به گروه هاي مختلف تقسيم کردند، حمايت از اوباما را در هر گروه تخمين زده و سپس به طور متوسط ​​برآورد گروهي براي تخمين کل انجام داد. به عنوان مثال، آنها می توانند جمعیت را به دو گروه (مردان و زنان) تقسیم کرده و حمایت اوباما را در میان مردان و زنان برآورد کرده و سپس کلیه حمایت های اوباما را با در نظر گرفتن میانگین وزنی برای حساب کردن این واقعیت که زنان 53 درصد از رای دهندگان و مردان 47 درصد است. به طور تقریبی، پس از طبقه بندی کمک می کند تا برای یک نمونه عدم تعادل درست شده با آوردن اطلاعات کمکی در مورد اندازه گروه ها.

کلیدی برای طبقه بندی پس از آن، تشکیل گروه های مناسب است. اگر شما می توانید جمعیت را به گروه های همگن تقسیم کنید به طوری که واکنش های واکنش برای هر کس در هر گروه یکسان است، و پس از طبقه بندی، برآوردهای بی طرفانه تولید می شود. به عبارت دیگر، طبقه بندي پس از طبقه بندي، برآوردهاي منصفانه اي خواهد داشت، اگر همه مردان تمایل به پاسخ را داشته باشند و همه زنان دارای یک هدف واکنش مشابه هستند. این فرضیه به نام فرض واکنش همگن-گرایش-در داخل گروه ها است و در انتهای این فصل کمی بیشتر در یادداشت های ریاضی توصیف می کنم.

البته، بعید به نظر می رسد که تمایلات پاسخ برای همه مردان و همه زنان یکسان است. با این حال، فرضیه همگن-واکنش-جهت گیری-درون گروه ها، به عنوان تعدادی از گروه ها افزایش می یابد. تقریبا، اگر شما گروه های بیشتری را ایجاد کنید، مردم به گروه های همگن تقلیل پیدا می کنند. به عنوان مثال، ممکن است به نظر نادرست برسد که همه زنان دارای یک هدف واکنش مشابه هستند، اما ممکن است بیشتر قابل قبول باشد که تمایل واکنش برای همه زنانی که در سن 18 تا 29 سالگی هستند، از کالج فارغ التحصیل شده و در کالیفرنیا زندگی می کنند . بنابراین، به عنوان تعداد گروه های مورد استفاده در پس از طبقه بندی بزرگ می شود، فرض های مورد نیاز برای حمایت از روش تبدیل به معقول تر است. با توجه به این واقعیت، محققان اغلب می خواهند تعدادی از گروه ها را بعد از طبقه بندی ایجاد کنند. با این حال، با افزایش تعداد گروهها، محققان به یک مشکل دیگر برمیخورند: دادههای کمیابی. اگر تنها تعداد کمی از افراد در هر گروه وجود داشته باشد، برآوردها بیشتر مشخص نیست و در مواردی که گروهی وجود دارد که پاسخگو نیستند، پس از طبقه بندی به طور کامل تجزیه می شود.

دو راه از این تنش ذاتی بین احتمال پذیری فرض همگن پاسخ-گرایش در داخل گروه ها و تقاضا برای اندازه نمونه های مناسب در هر گروه وجود دارد. اولا محققان می توانند یک نمونه بزرگتر و متنوع را جمع آوری کنند که به اطمینان از اندازه نمونه های مناسب در هر گروه کمک می کند. دوم، آنها می توانند از یک مدل آماری پیچیده تر برای برآورد در گروه ها استفاده کنند. و در حقیقت، گاهی اوقات محققان هر دو را انجام می دهند، همانطور که وانگ و همکارانش با مطالعه خود در مورد انتخابات با استفاده از پاسخ دهندگان از Xbox انجام دادند.

از آنجایی که آنها با استفاده از روش نمونه گیری غیر احتمالی با مصاحبه های کامپیوتری (بیشتر در مورد مصاحبه های کامپیوتری در بخش 3.5 صحبت می کنند)، وانگ و همکارانش اطلاعات جمع آوری اطلاعات بسیار ارزان داشتند، که آنها را قادر به جمع آوری اطلاعات از 345،858 شرکت کننده منحصر به فرد ، شمار زیادی توسط استانداردهای رای گیری انتخاباتی. این نمونه عظیم نمونه آنها را قادر ساخت تا تعداد زیادی از گروه های بعد از طبقه بندی را تشکیل دهند. وانگ و همکارانش جمعیت را به 176،256 گروه تقسیم شده بر اساس جنسیت (2 دسته)، نژاد (4 دسته)، سن (4 دسته)، آموزش (4 دسته)، دولت (51 دسته)، شناسنامه حزب (3 دسته)، ایدئولوژی (3 رده) و رای گیری سال 2008 (3 دسته). به عبارت دیگر، اندازه نمونه بزرگ آنها، که با جمع آوری داده های کم هزینه فعال شده بود، آنها را قادر ساخت تا پیش بینی های قابل قبولی در فرآیند برآورد خود داشته باشند.

با این حال، با 345،858 شرکت کننده منحصر به فرد، با وجود این هنوز تعداد بسیاری از گروه ها وجود داشت که وانگ و همکارانشان تقریبا هیچ پاسخ دهنده ای نداشتند. بنابراین، آنها با استفاده از یک روش رگرسیون چند سطحی برای برآورد حمایت در هر گروه استفاده کردند. اساسا، برای برآورد حمایت از اوباما در یک گروه خاص، رگرسیون چند مرحله ای اطلاعات را از گروه های نزدیک به هم پیوسته جمع کرد. به عنوان مثال، تصور کنید که تلاش برای برآورد حمایت از اوباما در میان زنان اسپانیایی که بین 18 تا 29 ساله هستند، فارغ التحصیلان کالج هستند که دموکرات ها ثبت نام کرده اند و خود را بعنوان معتدل شناخته اند و در سال 2008 برای اوباما رای دادند. ، گروه بسیار خاص است و ممکن است کسی در این نمونه با این ویژگی ها وجود داشته باشد. بنابراین، برای ارزیابی در مورد این گروه، رگرسیون چند مرحله ای از یک مدل آماری برای جمع آوری تخمین ها از افراد در گروه های بسیار مشابه استفاده می کند.

بنابراین، وانگ و همکارانش از رویکردی که ترکیبی از رگرسیون چندسطحی و پس از طبقه بندی را تشکیل می دهند، استفاده کردند، به این ترتیب آنها رگرسیون چند مرحله ای خود را با پسوند طبقه بندی یا، با مهربانی تر، نامیدند. P. "هنگامی که وانگ و همکارانش از آقای P. برای ارزیابی از نمونه غیر احتمالی XBox استفاده کردند، برآوردهای بسیار نزدیک به حمایت کلی که اوباما در انتخابات 2012 دریافت کرد (شکل 3.8) تولید کرد. در واقع برآوردهای آنها دقیق تر از جمع آوری نظرسنجی های عمومی سنتی بود. بنابراین، در این مورد، تنظیمات آماری، مخصوصا آقای P.، به نظر میرسد کار خوبی را انجام دهند تا اشتباهات را در دادههای غیر احتمالی اصلاح کنند. تعصب هایی که به وضوح قابل مشاهده هستند هنگامی که شما در برآورد از داده های غیر قابل تنظیم ایکس باکس نگاه کنید.

شکل 3.8: برآوردهای از W. Wang و همکاران. (2015). نمونه غیرقابل اصلاح XBox تخمین های نادرستی را تهیه کرد. اما، نمونهی وزن وزن XBox تولید تخمینی را که دقیقتر از میانگین مشاهدات تلفن مبتنی بر احتمال بود، انجام داد. از W. Wang و همکاران اقتباس شده است. (2015)، ارقام 2 و 3.

شکل 3.8: برآوردهای از W. Wang et al. (2015) . نمونه غیرقابل اصلاح XBox تخمین های نادرستی را تهیه کرد. اما، نمونهی وزن وزن XBox تولید تخمینی را که دقیقتر از میانگین مشاهدات تلفن مبتنی بر احتمال بود، انجام داد. از W. Wang et al. (2015) اقتباس شده W. Wang et al. (2015) ، ارقام 2 و 3.

دو مطالعه اصلی از مطالعه وانگ و همکارانش وجود دارد. اول، نمونه های غیر احتمالی غیر قابل تنظیم ممکن است به تخمین های بد منجر شود؛ این درس است که بسیاری از محققان قبل از آن شنیده اند. درس دوم، با این حال، این است که نمونه های غیر احتمالی، زمانی که به درستی تجزیه و تحلیل می شوند، می توانند برآوردهای خوبی را تولید کنند؛ نمونه های غیر احتمالی نیازمند به طور خودکار به چیزی شبیه فساد ادبی ادبیات نیازی ندارند.

اگر شما در حال تلاش برای تصمیم گیری در مورد استفاده از رویکرد نمونه گیری احتمالی و رویکرد نمونه گیری غیر احتمالی هستید، به جلو بروید، با انتخاب دشوار مواجه می شوید. گاهی اوقات محققان قواعد سریع و سخت را می خواهند (به عنوان مثال، همیشه از روش نمونه گیری احتمالی استفاده می کنند)، اما به طور فزاینده ای دشوار است که چنین قاعده ای ارائه شود. محققان با انتخاب روش دشواری بین روش های نمونه گیری احتمالی در عمل مواجه هستند که به طور فزاینده ای گران هستند و به دور از نتایج نظری که روش های نمونه گیری و استفاده از آنها را غیرقابل تصور می دانند، ارزان تر و سریع تر، اما کمتر شناخته شده و متنوع هستند. با این حال، یک نکته روشن این است که اگر شما مجبور به کار با نمونه های غیر احتمالی یا منابع داده های غیرواقعی بزرگ هستید (به فصل 2 نگاه کنید)، پس دلیل محکمی وجود دارد که اعتقاد بر این باشد که تخمین ها با استفاده از طبقه بندی و تکنیک های مرتبط با آن بهتر از پیش بینی های خام است.