مزيد من التعليق

تم تصميم هذا القسم لاستخدامها كمرجع، بدلا من أن يكون نصها كما السرد.

  • مقدمة (القسم 3.1)

كما تم ردد العديد من الموضوعات في هذا الفصل في عناوين الرئاسية الأخيرة في الجمعية الأمريكية لبحوث الرأي العام (AAPOR)، مثل Dillman (2002) ، Newport (2011) ، Santos (2014) ، و Link (2015) .

لمزيد من خلفية تاريخية عن تطور الدراسات المسحية، ونرى Smith (1976) و Converse (1987) . لمعرفة المزيد عن هذه الفكرة من ثلاثة عصور البحث المسحي، انظر Groves (2011) و Dillman, Smyth, and Christian (2008) (التي تتكسر العصور الثلاثة بشكل مختلف قليلا).

ذروة داخل الانتقال من الأول إلى الحقبة الثانية في الدراسات المسحية هي Groves and Kahn (1979) ، والتي لا مقارنة مفصلة من الرأس إلى الرأس بين وجها لوجه واجريت عبر الهاتف. Brick and Tucker (2007) ينظر إلى الوراء في التطور التاريخي للأرقام عشوائية أساليب أخذ العينات الطلب.

لأكثر كيف البحوث المسح قد تغيرت في الماضي استجابة للتغيرات في المجتمع، انظر Tourangeau (2004) ، Mitofsky (1989) ، و Couper (2011) .

  • المطلوب مقابل مراقبة (القسم 3.2)

يمكن التعرف على الحالات الداخلية عن طريق طرح أسئلة تكون مشكلة لأن في بعض الأحيان المستطلعين أنفسهم ليسوا على علم الدول الداخلية. على سبيل المثال، Nisbett and Wilson (1977) لدينا ورقة رائعة مع عنوان مذكر: "محدد أكثر مما كنا نستطيع أن نعرف: التقارير اللفظية على العمليات العقلية" في ورقة خلص الباحثون: "المواضيع في بعض الأحيان (أ) غير مدركين لل وجود التحفيز أن الأهم تأثر ردا على ذلك، (ب) يجهل وجود استجابة، و (ج) غير مدركين أن التحفيز قد أثر على استجابة ".

عن الحجج أن الباحثين أن يفضل سلوك الملاحظة للسلوك أو مواقف عنها، نرى Baumeister, Vohs, and Funder (2007) (علم النفس) و Jerolmack and Khan (2014) والاستجابات (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (علم الاجتماع). الفرق بين طرح الأسئلة ومراقبة أيضا ينشأ في الاقتصاد، حيث يتحدث الباحثون عن تفضيلات المعلنة وكشف. على سبيل المثال، يمكن للباحث يسأل المستطلعين عما إذا كانوا يفضلون تناول الآيس كريم أو الذهاب إلى صالة الألعاب الرياضية (تفضيلات ذكر) أو البحث يمكن أن نلاحظ كيف غالبا ما يأكل الناس الآيس كريم والذهاب الى صالة الالعاب الرياضية (تفضيلات كشف). وهناك شكوك عميقة من أنواع معينة من البيانات تفضيلات جاء في الاقتصاد (Hausman 2012) .

وهناك موضوع الرئيسي من هذه المناقشات هو أن السلوك المبلغ عنها ليست دقيقة دائما. ولكن، قد لا يكون السلوك تسجيلها تلقائيا دقيق، لا يجوز جمع على عينة من الفائدة، وربما لا تكون في متناول الباحثين. وهكذا، في بعض الحالات، وأعتقد أن السلوك المبلغ عنها يمكن أن تكون مفيدة. وعلاوة على ذلك، وهو الموضوع الرئيسي الثاني من هذه المناقشات هو أن التقارير عن العواطف، والمعرفة، والتوقعات، والآراء ليست دقيقة دائما. ولكن، إذا كانت هناك حاجة من المعلومات حول هذه الدول الداخلية من قبل الباحثين، إما للمساعدة في شرح بعض السلوك أو الشيء الذي يمكن تفسيره، ثم يسأل قد يكون مناسبا.

  • إجمالي الخطأ مسح (القسم 3.3)

لعلاج طول الكتاب على إجمالي الخطأ مسح، انظر Groves et al. (2009) أو Weisberg (2005) . لتاريخ تطور من إجمالي الخطأ مسح، انظر Groves and Lyberg (2010) .

من حيث التمثيل، مقدمة كبيرة لقضايا عدم الاستجابة والتحيز عدم الاستجابة هو تقرير المجلس الوطني للبحوث على عدم الاستجابة في العلوم الاجتماعية استطلاعات: جدول أعمال البحوث (2013) . وتقدم نظرة عامة أخرى مفيدة من قبل (Groves 2006) . أيضا، وقد تم نشر أعداد خاصة كاملة من مجلة للإحصاءات الرسمية، الرأي العام الفصلية، وحوليات الأكاديمية الأميركية للعلوم السياسية والاجتماعية حول موضوع عدم الاستجابة. وأخيرا، هناك في الواقع العديد من الطرق المختلفة لحساب معدل الاستجابة؛ يتم وصف هذه الأساليب بالتفصيل في تقرير صادر عن الجمعية الأمريكية للرأي العام الباحثون (AAPOR) (Public Opinion Researchers} 2015) .

وقد تمت دراسة استطلاع الأدبية دايجست 1936 بالتفصيل (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . كما تم استخدامه بمثابة المثل للتحذير من جمع البيانات العشوائية (Gayo-Avello 2011) . في عام 1936، وتستخدم جورج غالوب شكل أكثر تطورا من أخذ العينات، وكان قادرا على إنتاج تقديرات أكثر دقة مع عينة أصغر من ذلك بكثير. كان نجاح غالوب على مدى الأدبية دايجست علامة فارقة في تطوير البحث المسحي (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .

من حيث القياس، مورد العظيمة الأولى لتصميم الاستبانات هو Bradburn, Sudman, and Wansink (2004) . لعلاج أكثر تقدما تركز تحديدا على الأسئلة الموقف، نرى Schuman and Presser (1996) . أكثر على الأسئلة قبل الاختبار متاح في Presser and Blair (1994) ، Presser et al. (2004) ، والفصل 8 من Groves et al. (2009) .

العلاج الكلاسيكي، بطول كتاب المفاضلة بين تكاليف الدراسة والأخطاء الدراسة هي Groves (2004) .

  • من تسأل (القسم 3.4)

الكلاسيكية العلاج كتاب طول أخذ العينات احتمال القياسية وتقدير ل Lohr (2009) (المزيد التمهيدية) و Särndal, Swensson, and Wretman (2003) (أكثر تقدما). علاج بطول كتاب كلاسيكية من أساليب ما بعد التدرج وما يتصل بها هي Särndal and Lundström (2005) . في بعض الإعدادات العصر الرقمي والباحثين يعرفون تماما قليلا عن غير المجيبين، الذي لم يكن في كثير من الأحيان صحيحا في الماضي. أشكال مختلفة من التكيف عدم استجابة ممكنة عندما يكون الباحثون معلومات عن غير المجيبين (Kalton and Flores-Cervantes 2003; Smith 2011) .

دراسة إكس بوكس ل Wang et al. (2015) يستخدم تقنية تسمى الانحدار متعدد المستويات وما بعد التدرج (MRP، التي تسمى أحيانا "مستر بي") الذي يسمح للباحثين لتقدير خلية يعني حتى عندما تكون هناك العديد والعديد من الخلايا. على الرغم من أن هناك بعض النقاش حول نوعية التقديرات من هذه التقنية، فإنه يبدو وكأنه منطقة واعدة لاستكشاف. وقد استخدمت هذه التقنية لأول مرة في Park, Gelman, and Bafumi (2004) ، وكان هناك استخدام والنقاش اللاحق (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . لمعرفة المزيد عن العلاقة بين الأوزان الفردية والأوزان خلية القاعدة نرى Gelman (2007) .

لمناهج أخرى لاستطلاعات الويب الترجيح، انظر Schonlau et al. (2009) ، Valliant and Dever (2011) ، و Bethlehem (2010) .

واقترح مطابقة عينة من Rivers (2007) . Bethlehem (2015) يقول أن أداء مطابقة عينة سوف يكون في الواقع مشابهة لمناهج أخرى أخذ العينات (على سبيل المثال، وأخذ العينات الطبقية) ونهج التكيف الأخرى (على سبيل المثال، في مرحلة ما بعد التقسيم الطبقي). لمعرفة المزيد عن لوحات على الانترنت، انظر Callegaro et al. (2014) .

في بعض الأحيان وقد وجد الباحثون أن العينات الاحتمالية والعينات غير الاحتمالية تسفر عن تقديرات نوعية مماثلة (Ansolabehere and Schaffner 2014) قد وجدت، ولكن مقارنات أخرى أن العينات غير الاحتمالية تفعل أسوأ (Malhotra and Krosnick 2007; Yeager et al. 2011) . أحد الأسباب المحتملة لهذه الاختلافات هو أن العينات غير الاحتمالية قد تحسنت مع مرور الوقت. للحصول على عرض أكثر تشاؤما من طرق أخذ العينات غير الاحتمالية رؤية فرقة العمل AAPOR على أخذ العينات غير الاحتمالية (Baker et al. 2013) ، وأوصي أيضا قراءة التعليق الذي يلي تقرير موجز.

لتحليل تلوي على تأثير الترجيح للحد من التحيز في عينات غير الاحتمالية، انظر الجدول 2.4 في Tourangeau, Conrad, and Couper (2013) ، الأمر الذي يؤدي المؤلفين لإبرام "يبدو أن التعديلات أن تكون التصحيحات مفيدة ولكنها غير معصومة من الخطأ. . ".

  • كيفية طرح (القسم 3.5)

Conrad and Schober (2008) يوفر مجلدا بعنوان تصور مقابلة المسح للمستقبل، ويتناول العديد من الموضوعات في هذا القسم. Couper (2011) يتناول مواضيع مماثلة، و Schober et al. (2015) يقدم مثال جيد لكيفية طرق جمع البيانات التي صممت خصيصا لإعداد جديد يمكن أن يؤدي إلى بيانات عالية الجودة.

على سبيل المثال أخرى مثيرة للاهتمام من استخدام تطبيقات الفيسبوك لاستطلاعات العلوم الاجتماعية، انظر Bail (2015) .

لمزيد من النصائح على جعل استطلاعات تجربة ممتعة وقيمة للمشاركين، نرى العمل على مصممة منهج التصميم (Dillman, Smyth, and Christian 2014) .

Stone et al. (2007) يقدم العلاج طول كتاب تقييم حظة البيئي وأساليب ذات الصلة.

  • استطلاعات مرتبطة البيانات الأخرى (القسم 3.6)

Judson (2007) وصف عملية الجمع بين المسح والبيانات الإدارية، و"تكامل المعلومات"، يناقش بعض مزايا هذا النهج، ويقدم بعض الأمثلة.

وهناك طريقة أخرى يمكن للباحثين استخدامها آثار الرقمية والبيانات الإدارية إطار أخذ العينات لذوي خصائص معينة. ومع ذلك، الوصول إلى هذه السجلات إلى أن تستخدم إطار أخذ العينات ويمكن أيضا إنشاء الأسئلة المتعلقة بالخصوصية (Beskow, Sandler, and Weinberger 2006) .

وفيما يتعلق المطلوب تضخيمها، وهذا النهج ليس جديدا كما قد يبدو من كيفية لقد وصفه. هذا النهج لديه صلات عميقة إلى ثلاث مناطق واسعة في ما بعد التقسيم الطبقي على أساس إحصاءات طراز (Little 1993) ، الإسناد (Rubin 2004) ، وتقدير مساحة صغيرة (Rao and Molina 2015) . يرتبط أيضا إلى استخدام المتغيرات البديلة في البحوث الطبية (Pepe 1992) .

وبالإضافة إلى القضايا الأخلاقية المتعلقة الوصول إلى بيانات التتبع الرقمية، ويمكن أيضا أن تستخدم المطلوب تضخيم لاستنتاج الصفات الحساسة أن الناس قد لا يختار لتكشف في دراسة (Kosinski, Stillwell, and Graepel 2013) .

تقديرات التكاليف والوقت في Blumenstock, Cadamuro, and On (2015) تشير إلى أكثر من حيث التكلفة ومتغيرة تكلفة واحدة تكاليف الدراسة والإضافي لا تشمل الثابتة مثل تكلفة لتنظيف ومعالجة البيانات المكالمة. بصفة عامة، فإن الطلب تضخيم ربما يكون ارتفاع التكاليف الثابتة والتكاليف المتغيرة منخفضة مشابهة لتجارب الرقمية (انظر الفصل 4). مزيد من التفاصيل حول البيانات المستخدمة في Blumenstock, Cadamuro, and On (2015) ورقة هي في Blumenstock and Eagle (2010) و Blumenstock and Eagle (2012) . النهج من imputuation متعددة (Rubin 2004) قد يساعد على عدم اليقين القبض في تقديرات الطلب تضخيمها. لو قيض للباحثين القيام تضخيم يسأل فقط يهتمون المبالغ المجمعة، بدلا من الصفات على المستوى الفردي، ثم النهج في King and Lu (2008) و Hopkins and King (2010) قد يكون مفيدا. لمعرفة المزيد عن النهج تعلم الآلة في Blumenstock, Cadamuro, and On (2015) ، انظر James et al. (2013) (المزيد التمهيدية) أو Hastie, Tibshirani, and Friedman (2009) (أكثر تقدما). شعبية كتاب آخر تعلم الآلة هو Murphy (2012) .

وفيما يتعلق المطلوب المخصب، فإن النتائج في Ansolabehere وهيرش (2012) يتوقف على اثنين من الخطوات الرئيسية: 1) قدرة Catalist إلى الجمع بين العديد من مصادر البيانات المختلفة لإنتاج datafile Cesar: سيزار سيد دقيقة و 2) قدرة Catalist لربط بيانات المسح ل datafile Cesar: سيزار سيدها. لذلك، Ansolabehere وهيرش التحقق من كل خطوة من هذه الخطوات بعناية.

لإنشاء ملف البيانات الرئيسي، Catalist يجمع وينسق المعلومات من مصادر مختلفة عديدة منها: عدة سجلات التصويت لقطات من كل ولاية، والبيانات من تغيير الوطني من تسجيل عنوان مكتب البريد، ووالبيانات من مقدمي الخدمات التجارية غير محدد الآخرين. التفاصيل المروعة حول كيفية حدوث كل هذا التنظيف ودمج هي خارج نطاق هذا الكتاب، ولكن هذه العملية، مهما كان حذرا، سوف تنتشر أخطاء في مصادر البيانات الأصلية، وسوف أعرض أخطاء. على الرغم من أن Catalist مستعدة لمناقشة معالجة البيانات، وتوفير بعض البيانات الخام، فإنه كان من المستحيل ببساطة للباحثين لاستعراض خط أنابيب البيانات Catalist بأكمله. بدلا من ذلك، كان الباحثون في الحالة التي تكون فيها زيارتها ملف البيانات Catalist بعض غير معروف، وربما مجهول، وكمية من الخطأ. هذا هو مصدر قلق خطير لأن الناقد قد التكهن بأن الخلافات كبيرة بين تقارير المسح على CCES والسلوك في ملف البيانات الرئيسية Catalist كان سببها أخطاء في ملف البيانات الرئيسية، وليس بتقديم التقارير المغلوطة من شملهم الاستطلاع.

تولى Ansolabehere وهيرش نهجين مختلفين لمعالجة القلق جودة البيانات. أولا، بالإضافة إلى مقارنة التصويت المبلغ عنها ذاتيا للتصويت في الملف الرئيسي Catalist، قارن الباحثون أيضا حزب المبلغ عنها ذاتيا أو العرق أو الوضع تسجيل الناخبين (على سبيل المثال، مسجلة أو غير مسجلة) وطريقة التصويت (على سبيل المثال، في شخص، الغائب الاقتراع، الخ) إلى تلك القيم الموجودة في قواعد البيانات Catalist. هذه المتغيرات الديموغرافية أربعة، وجد الباحثون مستويات أعلى بكثير من اتفاق بين تقرير المسح والبيانات في الملف الرئيسي Catalist من التصويت. وهكذا، يبدو أن ملف البيانات الرئيسية Catalist الحصول على معلومات ذات جودة عالية لصفات أخرى من التصويت، مما يشير إلى أنه ليس من ضعف الجودة الشاملة. ثانيا، في جزء منه باستخدام بيانات من Catalist، وضعت Ansolabehere وهيرش ثلاثة تدابير مختلفة من نوعية السجلات مقاطعة التصويت، ووجدوا أن معدل يقدر بأكثر من الإبلاغ عن التصويت لا علاقة له أساسا إلى أي من هذه التدابير جودة البيانات، وهو الاكتشاف الذي تشير إلى أن ارتفاع معدلات الإفراط في تقديم التقارير لا يجري مدفوعا المقاطعات مع جودة البيانات منخفضة بشكل غير عادي.

ونظرا لإنشاء هذا الملف التصويت الرئيسي، والمصدر الثاني للأخطاء المحتملة هو ربط السجلات مسح إليها. على سبيل المثال، إذا تم هذا الربط غير صحيح يمكن أن يؤدي إلى الإفراط في تقدير الفرق بين السلوك الانتخابي ذكرت والتحقق من صحتها (Neter, Maynes, and Ramanathan 1965) . إذا كان كل شخص مستقر معرف فريدة من نوعها، التي كانت في كل من مصادر البيانات، ثم الربط ستكون تافهة. في البلدان الولايات المتحدة ومعظم أخرى، ومع ذلك، لا يوجد معرف العالمي. وعلاوة على ذلك، حتى لو كان هناك مثل هذا الشعب معرف ربما يكون مترددا لتقديمها إلى مسح الباحثين! وهكذا، كان Catalist للقيام الربط باستخدام معرفات الكمال، في هذه الحالة أربع قطع من معلومات حول كل المدعى عليه: الاسم والجنس وسنة الميلاد، وعنوان المنزل. على سبيل المثال، كان Catalist أن تقرر ما إذا كان Homie J سيمبسون في CCES نفس الشخص هو هوميروس جاي سيمبسون في ملف البيانات سيدهم. في الممارسة العملية، ومطابقة هو عملية صعبة وفوضوي، ومما زاد الطين بلة للباحثين، نظرت Catalist تقنية مطابقة لتكون الملكية.

من أجل التحقق من صحة خوارزميات المطابقة، أنها تعتمد على اثنين من التحديات. أولا، شارك Catalist في مسابقة المطابقة التي تم تشغيلها من قبل طرف ثالث مستقل: شركة ميتري. قدمت ميتري جميع المشاركين ملفين البيانات الصاخبة لتكون مطابقة، وتنافست فرق مختلفة للعودة إلى ميتري أفضل مطابقة. لأن ميتري نفسه عرف مطابقة الصحيح أنهم كانوا قادرين على تسجيل الفرق. من 40 شركة أن تنافس، جاء Catalist في المركز الثاني. هذا النوع من المستقلين، وتقييم من طرف ثالث التكنولوجيا الملكية نادرة جدا وقيمة لا يصدق. يجب أن تعطينا ثقة أن الإجراءات مطابقة Catalist هي أساسا في دولة من بين الفن. ولكن هو للدولة من بين الفن جيدة بما فيه الكفاية؟ وبالإضافة إلى هذه المسابقة مطابقة، تم إنشاؤها Ansolabehere وهيرش التحدي مطابقة الخاصة بهم لCatalist. وكان من مشروع سابق، Ansolabehere وهيرش جمعت سجلات الناخبين من ولاية فلوريدا. وقد وفرت بعض هذه السجلات مع بعض من حقولهم حجب لCatalist ثم مقارنة تقارير Catalist لهذه الحقول إلى قيمها الفعلية. لحسن الحظ، كانت تقارير Catalist وعلى مقربة من القيم حجب، مشيرا إلى أن Catalist يمكن أن تتطابق سجلات الناخبين جزئية على ملف البيانات سيدهم. هذه التحديات اثنين، واحد من قبل طرف ثالث واحدا تلو Ansolabehere وهيرش، تعطينا مزيدا من الثقة في خوارزميات مطابقة Catalist، على الرغم من أننا لا يمكن مراجعة تنفيذها بدقة أنفسنا.

كانت هناك العديد من المحاولات السابقة للتحقق من صحة التصويت. لمحة عامة عن هذا الأدب، انظر Belli et al. (1999) ، Berent, Krosnick, and Lupia (2011) ، Ansolabehere and Hersh (2012) ، و Hanmer, Banks, and White (2014) .

ومن المهم أن نلاحظ أنه على الرغم من في هذه الحالة تم تشجيع الباحثين من خلال نوعية البيانات من Catalist، كانت التقييمات الأخرى من الباعة التجارية أقل حماسا. وقد وجد الباحثون نوعية رديئة عندما بيانات من مسح لملف المستهلك من تسويق مجموعة الأنظمة (التي هي نفسها اندمجت معا البيانات من ثلاثة مقدمي: أكسيوم، اكسبريان، وInfoUSA) (Pasek et al. 2014) . وهذا يعني أن ملف البيانات لم تطابق الردود الدراسة أن الباحثين المتوقع أن يكون صحيحا، ملف البيانات والبيانات لعدد كبير من المسائل، والمفقودين نمط البيانات المفقودة تم ربطها قيمة مسح ذكرت (وبعبارة أخرى فإن البيانات المفقودة منهجي وليس عشوائي).

لمعرفة المزيد عن الربط بين سجل المسوحات والبيانات الإدارية، انظر Sakshaug and Kreuter (2012) و Schnell (2013) . لمعرفة المزيد عن الربط سجل في عام، انظر Dunn (1946) و Fellegi and Sunter (1969) (التاريخي) و Larsen and Winkler (2014) (الحديث). كما تم أيضا تطوير مناهج مماثلة في علوم الكمبيوتر تحت أسماء مثل إلغاء البيانات المكررة، وتحديد سبيل المثال، اسم مطابقة، الكشف مكررة، وكشف عن سجل مكررة (Elmagarmid, Ipeirotis, and Verykios 2007) . هناك أيضا خصوصية الحفاظ على النهج لتسجيل الربط التي لا تتطلب نقل معلومات التعريف الشخصية (Schnell 2013) . طور الباحثون في الفيسبوك إجراء ربط probabilisticsly سجلاتها إلى السلوك الانتخابي (Jones et al. 2013) . وقد تم هذا الربط لتقييم التجربة التي سوف اقول لكم عنها في الفصل 4 (Bond et al. 2012) .

مثال آخر على ربط المسح الاجتماعي على نطاق واسع إلى السجلات الإدارية الحكومة يأتي من الصحة والمسح التقاعد وإدارة الضمان الاجتماعي. لمعرفة المزيد عن هذه الدراسة، بما في ذلك المعلومات حول إجراء الموافقة، انظر Olson (1996) و Olson (1999) .

عملية الجمع بين العديد من مصادر السجلات الإدارية في الماجستير datafile Cesar: سيزار-العملية التي Catalist الموظفين أمر شائع في المكاتب الإحصائية لبعض الحكومات الوطنية. باحثان من الاحصائيات السويد وقد كتبت كتابا مفصلا عن هذا الموضوع (Wallgren and Wallgren 2007) . للحصول على مثال لهذا النهج في مقاطعة واحدة في الولايات المتحدة (مقاطعة أولمستيد، مينيسوتا، المنزل من مايو كلينك)، انظر Sauver et al. (2011) . لمعرفة المزيد عن الأخطاء التي يمكن أن تظهر في السجلات الإدارية، انظر Groen (2012) .