3.4 من تسأل

تم إنشاء هذه الترجمة بواسطة الكمبيوتر. ×

3.4 من تسأل

العصر الرقمي يجعل أخذ العينات الاحتمالية في الممارسة أكثر صعوبة ويخلق فرصا جديدة لأخذ العينات غير الاحتمالية.

في تاريخ أخذ العينات ، كان هناك طريقتين متنافستين: طرق أخذ العينات الاحتمالية وطرق أخذ العينات غير الاحتمالية. وبالرغم من استخدام كلا النهجين في الأيام الأولى من أخذ العينات ، فقد أصبحت السيطرة على أخذ العينات محتملاً ، ويتعلم العديد من الباحثين الاجتماعيين النظر إلى أخذ العينات غير الاحتمالية بشكوك كبيرة. ومع ذلك ، وكما سأوضح أدناه ، فإن التغييرات التي أحدثها العصر الرقمي تعني أن الوقت قد حان للباحثين لإعادة النظر في أخذ العينات غير الاحتمالية. على وجه الخصوص ، أخذ أخذ العينات الاحتمال من الصعب القيام به في الممارسة ، وأخذ العينات غير الاحتمالية أسرع وأرخص وأفضل. لا تعد الاستطلاعات الأسرع والأرخص غاية في حد ذاتها: فهي تتيح فرصًا جديدة مثل الاستبيانات الأكثر تكرارية وأكبر أحجام العينات. على سبيل المثال ، باستخدام أساليب غير الاحتمالية ، تستطيع دراسة الاتحاد التعاوني للانتخابات (CCES) أن يكون لديها ما يقرب من 10 مرات من المشاركين أكثر من الدراسات السابقة باستخدام أخذ العينات الاحتمالية. هذه العينة الأكبر بكثير تمكن الباحثين السياسيين من دراسة التباين في المواقف والسلوك عبر المجموعات الفرعية والسياقات الاجتماعية. علاوة على ذلك ، جاء كل هذا الحجم الإضافي دون انخفاض في جودة التقديرات (Ansolabehere and Rivers 2013) .

حاليا ، النهج السائد لأخذ العينات للبحث الاجتماعي هو أخذ العينات الاحتمالية . في أخذ العينات الاحتمالي ، يكون لدى جميع أعضاء المجموعة المستهدفة احتمالية غير صفرية لاقتناص عينات ، ويستجيب جميع الأشخاص الذين تم أخذ عينات منهم إلى المسح. عندما يتم استيفاء هذه الشروط ، تقدم النتائج الرياضية الأنيقة ضمانات مضمونة حول قدرة الباحث على استخدام العينة لإجراء استنتاجات حول السكان المستهدفين.

في العالم الحقيقي ، ومع ذلك ، ونادرا ما يتم استيفاء الشروط الكامنة وراء هذه النتائج الرياضية. على سبيل المثال ، غالبًا ما تكون هناك أخطاء في التغطية وعدم الاستجابة. بسبب هذه المشاكل ، غالباً ما يضطر الباحثون إلى توظيف مجموعة متنوعة من التعديلات الإحصائية من أجل الاستدلال من العينة على السكان المستهدفين. وبالتالي ، من المهم التمييز بين أخذ العينات الاحتمالية نظرياً ، الذي يحتوي على ضمانات نظرية قوية ، وأخذ عينات من الاحتمالية في الممارسة ، والتي لا توفر مثل هذه الضمانات وتعتمد على مجموعة متنوعة من التعديلات الإحصائية.

مع مرور الوقت ، ازدادت الفروق بين أخذ العينات الاحتمالية من الناحية النظرية ومن أخذ العينات الاحتمالية في الممارسة. على سبيل المثال ، كانت معدلات عدم الإجابة تتزايد باطراد ، حتى في الدراسات الاستقصائية باهظة الثمن عالية الجودة (الشكل 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) . معدلات عدم الإجابة أعلى بكثير في الاستطلاعات الهاتفية التجارية - وفي بعض الأحيان تصل إلى 90٪ (Kohut et al. 2012) . هذه الزيادات في عدم الاستجابة تهدد جودة التقديرات لأن التقديرات تعتمد بشكل متزايد على النماذج الإحصائية التي يستخدمها الباحثون للتكيف من أجل عدم الاستجابة. علاوة على ذلك ، حدث هذا الانخفاض في الجودة على الرغم من الجهود الباهظة الثمن من قبل الباحثين في مجال المسح للحفاظ على معدلات استجابة عالية. يخشى بعض الناس من أن هذه الاتجاهات المزدوجة في خفض الجودة وزيادة التكلفة تهدد أساس أبحاث المسح (National Research Council 2013) .

اﻟﺷﮐل 3.5: ﻟم ﯾﮐن اﻻﺳﺗﺟﺎﺑﺔ ﻣﺗزاﯾدة ﺑﺷﮐل ﻣﺗزاﯾد ، ﺣﺗﯽ ﻓﻲ اﻻﺳﺗﺑﯾﺎﻧﺎت اﻟﻣرﺗﻔﻌﺔ اﻟﻣرﺗﻔﻌﺔ اﻟﺟودة (اﻟﻣﺟﻟس اﻟوطﻧﻲ ﻟﻟﺑﺣث 2013 ؛ ب. د. ﻣﺎﯾر ، ﻣوك ، ﺳوﻟﯾﻔﺎن 2015). معدلات عدم الإجابة أعلى بكثير بالنسبة لمسوحات الهواتف التجارية ، وأحيانًا تصل إلى 90٪ (Kohut et al. 2012). هذه الاتجاهات طويلة المدى في عدم الإجابة تعني أن جمع البيانات أكثر تكلفة وأن التقديرات أقل موثوقية. مقتبس من B. D. Meyer و Mok و Sullivan (2015) ، الشكل 1.

اﻟﺷﮐل 3.5: ﻟم ﯾﮐن اﻻﺳﺗﺟﺎﺑﺔ ﻣﺗزاﯾدة ﺑﺷﮐل ﻣﺗزاﯾد ، ﺣﺗﯽ ﻓﻲ اﻟدراﺳﺎت اﻟﻣرﺗﻔﻌﺔ اﻟﻣرﺗﻔﻌﺔ اﻟﺟودة (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) . معدلات عدم الإجابة أعلى بكثير بالنسبة لمسوحات الهواتف التجارية ، وأحيانًا تصل إلى 90٪ (Kohut et al. 2012) . هذه الاتجاهات طويلة المدى في عدم الإجابة تعني أن جمع البيانات أكثر تكلفة وأن التقديرات أقل موثوقية. مقتبس من BD Meyer, Mok, and Sullivan (2015) ، الشكل 1.

في الوقت نفسه الذي كانت هناك صعوبات متزايدة لطرق أخذ العينات الاحتمالية ، كانت هناك أيضا تطورات مثيرة في طرق أخذ العينات غير الاحتمالية . هناك مجموعة متنوعة من أساليب أساليب أخذ العينات غير الاحتمالية ، ولكن الشيء الوحيد المشترك بينها هو أنها لا يمكن أن تتلاءم بسهولة مع الإطار الرياضي لأخذ العينات الاحتمالية (Baker et al. 2013) . وبعبارة أخرى ، في أساليب أخذ العينات غير الاحتمالية ليس لدى كل شخص احتمالية معروفة وغير صفرية للإدراج. تتميز طرق أخذ العينات غير الاحتمالية بسمعة مروعة بين الباحثين الاجتماعيين وترتبط ببعض الفشل الأكثر إثارة للباحثين في مجال المسح ، مثل الفشل الأدبي في دايجست (الذي تمت مناقشته في وقت سابق) و "ديوي هزائم ترومان" ، وهو التنبؤ غير الصحيح عن الولايات المتحدة. الانتخابات الرئاسية لعام 1948 (الشكل 3.6).

الشكل 3-6: حمل الرئيس هاري ترومان العنوان الرئيسي لصحيفة أعلنت خطأً عن هزيمته. استند هذا العنوان في جزء منه إلى تقديرات من عينات غير احتمالية (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) . على الرغم من أن "ديوي هزائم ترومان" حدث في عام 1948 ، فإنه لا يزال من بين الأسباب التي تجعل بعض الباحثين يشككون في تقديرات من العينات غير الاحتمالية. المصدر: مكتبة ومتحف هاري ترومان .

يتمثل أحد أشكال العينات غير الاحتمالية المناسبة بشكل خاص للعصر الرقمي في استخدام اللوحات عبر الإنترنت . يعتمد الباحثون الذين يستخدمون لوحات الإنترنت على مزود موفر للوحة — عادة شركة أو حكومة أو جامعة — لبناء مجموعة كبيرة ومتنوعة من الأشخاص الذين يوافقون على العمل كمستجيبين للدراسات الاستقصائية. وغالبًا ما يتم تعيين هؤلاء المشاركين في المنتدى باستخدام مجموعة متنوعة من الطرق المخصصة مثل إعلانات البانر على الإنترنت. وبعد ذلك ، يمكن للباحث أن يدفع لمزود اللوحة إمكانية الوصول إلى عينة من المستجيبين الذين لديهم الخصائص المرغوبة (مثل الممثلين الوطنيين للبالغين). هذه اللوحات على الإنترنت هي أساليب غير احتمالية لأن ليس لدى الجميع احتمالية معروفة ، غير صفرية للإدراج. على الرغم من استخدام لوحات الإنترنت غير الاحتمالية بالفعل من قبل الباحثين الاجتماعيين (على سبيل المثال ، CCES) ، لا يزال هناك بعض الجدل حول جودة التقديرات التي تأتي منها (Callegaro et al. 2014) .

على الرغم من هذه المناقشات ، أعتقد أن هناك سببين يجعل الوقت مناسبًا للباحثين الاجتماعيين لإعادة النظر في أخذ العينات غير الاحتمالية. أولاً ، في العصر الرقمي ، حدثت تطورات كثيرة في جمع وتحليل العينات غير الاحتمالية. هذه الطرق الجديدة مختلفة بما فيه الكفاية عن الطرق التي تسببت في مشاكل في الماضي والتي أعتقد أنه من المنطقي أن نفكر فيها على أنها "أخذ العينات غير الاحتمالية 2.0". والسبب الثاني الذي ينبغي على الباحثين إعادة النظر في أخذ العينات غير الاحتمالية هو أن أخذ العينات في أصبحت ممارسة صعبة على نحو متزايد. عندما تكون هناك معدلات عالية من عدم الاستجابة - كما هو الحال في الدراسات الاستقصائية الحقيقية الآن - فإن الاحتمالات الفعلية للإدراج بالنسبة للمستجيبين غير معروفة ، وبالتالي ، فإن عينات الاحتمالات والعينات غير الاحتمالية ليست مختلفة كما يعتقد العديد من الباحثين.

وكما قلت من قبل ، فإن العديد من الباحثين الاجتماعيين ينظرون إلى العينات غير الاحتمالية بشكل كبير ، ويرجع ذلك جزئياً إلى دورهم في بعض أكثر الفشل إحراجاً في الأيام الأولى لأبحاث المسح. ومن الأمثلة الواضحة على مدى قدومنا مع العينات غير الاحتمالية البحث الذي أجراه وي وانج وديفيد روثشايلد وشراد جويل وأندرو جيلمان (2015) الذي استرد بشكل صحيح نتيجة الانتخابات الأمريكية عام 2012 باستخدام عينة غير محتملة من مستخدمي أجهزة إكس بوكس الأمريكية - وهي عينة غير عشوائية من الأمريكيين. قام الباحثون بتوظيف المستجيبين من نظام ألعاب XBox ، وكما قد تتوقعون ، فإن عينة إكس بوكس انحرفت عن الذكور والذكور المنحرفين: يشكل 18 إلى 29 عامًا 19٪ من الناخبين ولكن 65٪ من عينة إكس بوكس ، والرجال تشكل 47 ٪ من الناخبين ولكن 93 ٪ من عينة إكس بوكس (الشكل 3.7). بسبب هذه التحيزات الديموغرافية القوية ، كانت بيانات Xbox الخام مؤشر ضعيف لعائدات الانتخابات. وتنبأ بانتصار قوي لميت رومني على باراك أوباما. مرة أخرى ، هذا مثال آخر على أخطار العينات غير الاحتمالية غير المعدلة ، ويعيد إلى الأذهان الفشل الذريع للأدب .

الشكل 3.7: التركيبة السكانية للمستجيبين في W. Wang et al. (2015) . ولأن المجيبين تم تجنيدهم من XBox ، فمن المرجح أن يكونوا صغارًا ومن المرجح أن يكونوا ذكورًا ، بالنسبة إلى الناخبين في انتخابات 2012. مقتبس من W. Wang et al. (2015) ، الشكل 1.

ومع ذلك ، كان وانغ وزملاؤه على دراية بهذه المشكلات وحاولوا التكيف مع عملية أخذ العينات غير العشوائية عند إجراء التقديرات. على وجه الخصوص ، استخدموا بعد التقسيم الطبقي ، وهي تقنية تستخدم أيضا على نطاق واسع لضبط عينات الاحتمالات التي لديها أخطاء التغطية وعدم الاستجابة.

تتمثل الفكرة الرئيسية للطبقة التالية في استخدام المعلومات الإضافية حول السكان المستهدفين للمساعدة في تحسين التقدير الذي يأتي من العينة. عند استخدام التقسيم اللاحق لتقدير التقديرات من العينة غير الاحتمالية ، قام وانغ وزميله بتقطيع السكان إلى مجموعات مختلفة ، وقدر الدعم لأوباما في كل مجموعة ، ثم أخذ متوسطًا مرجحًا لتقديرات المجموعة لإنتاج تقدير عام. على سبيل المثال ، يمكن أن يكونوا قد قسموا السكان إلى مجموعتين (رجال ونساء) ، قدروا دعم أوباما بين الرجال والنساء ، ثم قدروا الدعم الكلي لأوباما من خلال أخذ متوسط مرجح من أجل حساب حقيقة أن النساء يصنعن 53٪ من الناخبين والرجال 47٪. تقريبًا ، يساعد التذييل اللاحق على تصحيح عينة غير متوازنة عن طريق جلب معلومات إضافية حول أحجام المجموعات.

المفتاح إلى مرحلة ما بعد التقسيم هو تشكيل المجموعات الصحيحة. إذا كان بإمكانك تقسيم السكان إلى مجموعات متجانسة بحيث تكون سمات الاستجابة هي نفسها لكل شخص في كل مجموعة ، فإن التذييل اللاحق سوف ينتج تقديرات غير متحيزة. وبعبارة أخرى ، فإن التقدّم في مرحلة ما بعد الجندر حسب الجنس سيؤدي إلى تقديرات غير منحازة إذا كان لدى جميع الرجال نزوع في الاستجابة ، ولجميع النساء نفس اتجاه الاستجابة. يدعى هذا الافتراض الافتراض المتجانس-الاستجابة-الغرائبية-داخل-المجموعات ، وأصفها أكثر قليلاً في الملاحظات الرياضية في نهاية هذا الفصل.

بطبيعة الحال ، يبدو من غير المرجح أن تكون استجابات الاستجابة هي نفسها لجميع الرجال والنساء. ومع ذلك ، يصبح الافتراض المتجانس-الاستجابة-الغرائبية-داخل-المجموعات أكثر جدارة مع زيادة عدد المجموعات. يصبح من الأسهل تقطيع السكان إلى مجموعات متجانسة إذا قمت بإنشاء مجموعات أكثر. على سبيل المثال ، قد يبدو من غير المعقول أن يكون لدى جميع النساء نفس اتجاه الاستجابة ، ولكن قد يبدو أكثر منطقية أن هناك نفس اتجاه الاستجابة لكل النساء اللواتي تتراوح أعمارهن بين 18 و 29 عامًا ، اللاتي تخرجن من الكلية ، ويعيشن في كاليفورنيا . وبالتالي ، كلما زاد عدد المجموعات المستخدمة في مرحلة ما بعد التقسيم الطبقي ، أصبحت الافتراضات اللازمة لدعم الطريقة أكثر منطقية. بالنظر إلى هذه الحقيقة ، غالباً ما يرغب الباحثون في إنشاء عدد كبير من المجموعات من أجل مرحلة ما بعد التقسيم إلى طبقات. ومع ذلك ، مع زيادة عدد المجموعات ، يواجه الباحثون مشكلة مختلفة: تفاوت البيانات. إذا لم يكن هناك سوى عدد قليل من الأشخاص في كل مجموعة ، فإن التقديرات ستكون أكثر غموضاً ، وفي الحالة القصوى حيث توجد مجموعة لا يوجد لديها مستجيبين ، ثم يتم تقسيمها بعد ذلك تمامًا.

هناك طريقتان للخروج من هذا التوتر المتأصل بين معقولية فرضية التجاوب-الاستجابة-النزوع-داخل-مجموعات والطلب على أحجام عينة معقولة في كل مجموعة. أولا ، يمكن للباحثين جمع عينة أكبر وأكثر تنوعا ، مما يساعد على ضمان أحجام عينة معقولة في كل مجموعة. ثانياً ، يمكنهم استخدام نموذج إحصائي أكثر تعقيدًا لإعداد التقديرات داخل المجموعات. وفي الواقع ، في بعض الأحيان يقوم الباحثون بعمل كلاهما ، كما فعل وانغ وزملاؤه في دراستهم للانتخابات باستخدام المجيبين من Xbox.

ولأنهم كانوا يستخدمون طريقة أخذ العينات غير الاحتمالية مع المقابلات التي تتم بإدارة الكمبيوتر (سوف أتحدث أكثر عن المقابلات التي يديرها الكمبيوتر في القسم 3.5) ، كان لدى وانج وزملاؤه جمع بيانات غير مكلفة للغاية ، مما مكنهم من جمع المعلومات من 345،858 مشاركًا فريدًا ، عدد ضخم من معايير الاقتراع الانتخابات. مكنهم حجم العينة الضخم هذا من تكوين عدد كبير من مجموعات ما بعد التقسيم الطبقي. في حين أن تصنيف ما بعد التقسيم يتضمن عادة تقسيم السكان إلى مئات المجموعات ، قسم وانغ وزملاؤه السكان إلى 176،256 مجموعة محددة حسب الجنس (فئتين) ، والعرق (4 فئات) ، والعمر (4 فئات) ، والتعليم (4 فئات) ، والدولة (51 فئة) ، معرف الطرف (3 فئات) ، الأيديولوجية (3 فئات) ، و تصويت 2008 (3 فئات). وبعبارة أخرى ، فإن حجم العينة الضخم ، الذي تم تمكينه من خلال جمع البيانات منخفضة التكلفة ، مكنهم من تقديم افتراض أكثر معقولية في عملية تقديرهم.

حتى مع وجود 345،858 مشاركًا فريدًا ، لا تزال هناك العديد من المجموعات التي لم يكن لدى وانج وزملاؤها أي مستجيبين تقريبًا. لذلك ، استخدموا تقنية تسمى الانحدار متعدد المستويات لتقدير الدعم في كل مجموعة. أساسا ، لتقدير الدعم لأوباما ضمن مجموعة محددة ، جمعت الانحدار متعدد المستويات المعلومات من العديد من المجموعات وثيقة الصلة. على سبيل المثال ، تخيل محاولة تقدير الدعم لأوباما بين النساء اللاتينيات اللاتين تتراوح أعمارهن بين 18 و 29 سنة ، وهن خريجات جامعات ، وهن من الديمقراطيين المسجلين ، الذين يعرفون أنفسهم كمعتدلين ، والذين صوتوا لصالح أوباما في عام 2008. هذا ، ومجموعة محددة للغاية ، وأنه من الممكن أن لا يوجد أحد في العينة مع هذه الخصائص. لذلك ، ولإجراء تقديرات حول هذه المجموعة ، يستخدم الانحدار متعدد المستويات نموذجًا إحصائيًا لجمع التقديرات من أشخاص في مجموعات متشابهة جدًا.

وهكذا ، استخدم وانغ وزملاؤه منهجا يجمع بين الانحدار متعدد المستويات وما بعد التقسيم ، لذلك وصفوا استراتيجيتهم بانحدار متعدد المستويات مع ما بعد التقسيم الطبقي ، أو أكثر ، P. "عندما استخدم وانغ وزملاؤه السيد ب. لعمل تقديرات من عينة XBox غير الاحتمالية ، قاموا بإنتاج تقديرات قريبة جدًا من الدعم الكلي الذي تلقاه أوباما في انتخابات 2012 (الشكل 3.8). في الواقع كانت تقديراتهم أكثر دقة من مجموع استطلاعات الرأي العام التقليدية. وبالتالي ، في هذه الحالة ، يبدو أن التعديلات الإحصائية - تحديدًا السيد P. - تؤدي مهمة جيدة لتصحيح التحيزات في البيانات غير الاحتمالية ؛ التحيز التي كانت مرئية بوضوح عند النظر إلى التقديرات من بيانات Xbox غير المعدلة.

الشكل 3.8: تقديرات من W. Wang et al. (2015) . أنتجت عينة XBox غير المعدلة تقديرات غير دقيقة. ولكن ، أنتجت عينة XBox المرجحة تقديرات كانت أكثر دقة من متوسط الاستطلاعات الهاتفية القائمة على الاحتمالية. مقتبس من W. Wang et al. (2015) ، الشكلين 2 و 3.

هناك درسان رئيسيان من دراسة وانغ وزملائه. أولاً ، يمكن أن تؤدي العينات غير الاحتمالية غير المعدلة إلى تقديرات سيئة ؛ هذا درس استمع إليه العديد من الباحثين من قبل. ومع ذلك ، فإن الدرس الثاني هو أن العينات غير الاحتمالية ، عند تحليلها بشكل صحيح ، يمكن أن تنتج بالفعل تقديرات جيدة ؛ لا تحتاج العيّنات غير الاحتمالية إلى شيء ما مثل فشل الدليل الأدبي .

من الآن فصاعدًا ، إذا كنت تحاول اتخاذ قرار بين استخدام طريقة أخذ العينات الاحتمالية ونهج أخذ العينات غير الاحتمالي ، فإنك تواجه خيارًا صعبًا. في بعض الأحيان ، يريد الباحثون قاعدة سريعة وجامدة (على سبيل المثال ، استخدام أساليب أخذ العينات المحتملة على الدوام) ، ولكن من الصعب بشكل متزايد تقديم مثل هذه القاعدة. يواجه الباحثون خيارًا صعبًا بين أساليب أخذ العينات الاحتمالية في الممارسة - والتي تكون باهظة التكلفة وبعيدة عن النتائج النظرية التي تبرر استخدامها - وأساليب أخذ العينات غير الاحتمالية - وهي أرخص وأسرع ، ولكنها أقل دراية وأكثر تنوعًا. هناك أمر واحد واضح ، مع ذلك ، أنه إذا أجبرت على العمل مع عينات غير احتمالية أو مصادر بيانات كبيرة غير تمثيلية (فكر مرة أخرى في الفصل الثاني) ، فهناك سبب قوي للاعتقاد بأن التقديرات قد تم إجراؤها باستخدام التقسيمات اللاحقة التقنيات ذات الصلة ستكون أفضل من التقديرات الأولية غير المعدلة.