פרשנות נוספת

סעיף זה נועד לשמש כהפניה, ולא להיקרא כסיפור.

  • מבוא (סעיף 3.1)

רבים מן הנושאים בפרק זה גם כבר הדהדו כתובות האחרונות לנשיאות ב האגודה האמריקנית של דעת קהל מחקר (AAPOR), כגון Dillman (2002) , Newport (2011) , Santos (2014) , ואת Link (2015) .

עבור רקע היסטורי יותר על התפתחות מחקר סקר ראה Smith (1976) ו Converse (1987) . למידע נוסף על הרעיון של שלוש תקופות של מחקר הסקר ראה Groves (2011) ו Dillman, Smyth, and Christian (2008) (אשר שוברת את שלושת העידנים מעט שונה).

פסגה בתוך המעבר הראשון בעידן השני במחקר הסקר הוא Groves and Kahn (1979) , אשר עושה השוואה ראש אל ראש מפורט בין פנים-אל-פנים סקר טלפוני. Brick and Tucker (2007) מסתכל אחורה על ההתפתחות ההסטורית של שיטות דגימת חיוג ספרות אקראית.

למידע נוסף כיצד מחקר הסקר השתנה בעבר בתגובה לשינויים בחברה, ראה Tourangeau (2004) , Mitofsky (1989) , ו Couper (2011) .

  • מבוקש לעומת התבוננות (סעיף 3.2)

למידה על מצבים פנימיים על ידי שאילת שאלות יכולה להיות בעייתית כי לפעמים המשיבים עצמם אינם מודעים המצבים הפנימיים שלהם. לדוגמא, Nisbett and Wilson (1977) יש מאמר נפלא עם הכותרת המעוררת: "להגיד יותר ממה שאנחנו יכולים לדעת:. דיווחים מילוליים על תהליכים נפשיים" לא מזמן בעיתון החוקרים מסכמים: "נושאים הם לפעמים (א) מודעים קיומו של גירוי חשוב שפיעת תגובה, (ב) ידע על קיומו של התגובה, ו- (ג) לא מודע לכך הגירוי השפיע על התגובה. "

לטיעונים שהחוקרים צריכים מעדיפים התנהגות שנצפו להתנהגות או עמדות הדוח, ראה Baumeister, Vohs, and Funder (2007) (פסיכולוגיה) ו Jerolmack and Khan (2014) ותגובות (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (סוציולוגיה). ההבדל בין לשאול והתבוננות עולה גם בכלכלה, שבו חוקרים לספר איזו כאמור וגילה. לדוגמה, חוקר יכול לבקש המשיבים אם הם מעדיפים לאכול גלידה או הולך לחדר כושר (העדפות כאמור) או המחקר יוכל להתבונן באיזו תדירות אנשים אוכלים גלידה וללכת (העדפות גילה) וחדר כושר. יש ספקנות עמוקה של סוגים מסוימים של נתונים העדפות כאמור בכלכלה (Hausman 2012) .

נושא מרכזי מן הוויכוחים האלה הוא שההתנהגות מדווחת לא תמיד מדויקת. אבל, התנהגות נרשמת באופן אוטומטי עשויה להיות לא מדויקת, לא יכולה להיות שנאספה על מדגם של עניין, ולא יכולה להיות נגיש לחוקרים. לפיכך, במצבים מסוימים, אני חושב שהתנהגות מדווחת עשויה להיות שימושית. יתר על כן, נושא שני עיקרי מן הוויכוחים האלה זה שדיווחים על רגשות, ידע, ציפיות, וחוות דעת לא תמיד מדויקים. אבל, אם מידע על המצבים הפנימיים אלה נדרשים על ידי חוקרים או כדי להסביר התנהגות מסוימת או כמו הדבר כדי להסביר-ואז לשאול עשוי להיות מתאים.

  • שגיאת סקר סה"כ (סעיף 3.3)

לקבלת טיפולי אורך ספר על שגיאת סקר סה"כ, ראה Groves et al. (2009) או Weisberg (2005) . במשך היסטוריה של ההתפתחות של שגיאת סקר סה"כ, ראה Groves and Lyberg (2010) .

מבחינת ייצוג, דרך מצוינת להתחיל ולטפל בנושאים של אי-השבה והטיית הלא בתגובה הוא דו"ח המועצה הלאומית למחקר על השבה בסקרי מדעי החברה: סדר יום מחקרי (2013) . עוד סקירה שימושית מסופקת על ידי (Groves 2006) . כמו כן, בעיות מיוחדות כולו של ה- Journal of הסטטיסטיקה הרשמית, דעת קהל רבעונים, ו- The Annals of the American Academy of הפוליטי וחברתי המדע פורסמו בנושא של אי-שבה. לבסוף, ישנם הרבה דרכים שונות של חישוב שיעור התגובה; אלה גישות מתוארות בפירוט בדו"ח על ידי האגודה האמריקנית של חוקרי דעת קהל (AAPOR) (Public Opinion Researchers} 2015) .

סקר Digest הספרותי 1936 נחקר בפירוט (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . כמו כן נעשה שימוש כמשל להזהיר מפני איסוף נתונים אקראיים (Gayo-Avello 2011) . בשנת 1936, ג'ורג 'גאלופ השתמש בצורה מתוחכמת יותר של דגימה, והיה מסוגל לייצר אומדנים מדויקים יותר עם מדגם קטן בהרבה. ההצלחה של גאלופ מעל התקציר הספרותי הייתה אבן דרך בפיתוח של סקרי דעת קהל (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .

מבחינת מדידה, משאב ראשון נהדר עבור שאלונים בעיצוב הוא Bradburn, Sudman, and Wansink (2004) . לקבלת טיפול מתקדם יותר ממוקד בעיקר בשאלות יחס, לראות Schuman and Presser (1996) . עוד על שאלות מראש בדיקות זמין Presser and Blair (1994) , Presser et al. (2004) , ופרק 8 של Groves et al. (2009) .

קלאסי, טיפול באורך בספר של trade-off בין עלויות הסקר ושגיאות הסקר הוא Groves (2004) .

  • מי לשאול (סעיף 3.4)

טיפול ספר באורך קלסי של דגימה ואמידה הסתברות רגילות הם Lohr (2009) (יותר מבוא) ו Särndal, Swensson, and Wretman (2003) (מתקדם יותר). טיפול ספר באורך הקלאסי של שיטות שלאחר ריבוד וקשור הוא Särndal and Lundström (2005) . בהגדרות בעידן דיגיטליות מסוימות, חוקרים יודעים לא מעט על הלא משיבים, וזה קרה לעתים רחוקות נכון בעבר. צורות שונות של התאמה שאינה בתגובה אפשריות כאשר יש חוקרים פרטים על-משיבים שאינם (Kalton and Flores-Cervantes 2003; Smith 2011) .

מחקר Xbox של Wang et al. (2015) משתמשת בטכניקה הנקראת רגרסיה מדורגת וריבוד-פוסט (MRP, המכונה לעתים "מר P") המאפשר לחוקרים להעריך התא אומר גם כאשר ישנם תאים רבים, רבים. למרות שיש איזשהו דיון לגבי האיכות של הערכות של הטכניקה הזו, זה נראה כמו אזור מבטיח לחקור. הטכניקה שימש לראשונה Park, Gelman, and Bafumi (2004) , ו חלה השימוש הבאים ודיון (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . למידע נוסף על הקשר בין משקולות בודדות ומשקלים מבוססי תאים לראות Gelman (2007) .

עבור גישות אחרות סקרי אינטרנט שקלול ראה Schonlau et al. (2009) , Valliant and Dever (2011) , ואת Bethlehem (2010) .

התאמת לדוגמא הוצע על ידי Rivers (2007) . Bethlehem (2015) טוען כי הביצועים של התאמת מדגם בעצם יהיו דומים גישות דגימה אחרות (למשל, דגימה מרובדת) וגישות התאמה אחרות (למשל, פוסט-ריבוד). למידע נוסף על לוחות באינטרנט, לראות Callegaro et al. (2014) .

לפעמים חוקרים מצאו כי דגימות ההסתברות ודוגמאות הלא ההסתברות להניב אומדנים באיכות דומה (Ansolabehere and Schaffner 2014) , אך השוואות אחרים מצאו כי דגימות הלא הסתברות לעשות גרוע (Malhotra and Krosnick 2007; Yeager et al. 2011) . אחת סיבות אפשריות להבדלים אלה הן כי דגימות הלא הסתברות שפרו לאורך זמן. כדי ליהנות מנוף פסימי יותר של שיטות לדגימה שאינה הסתברות לראות את כוח משימת AAPOR על דגימה ללא הסתברות (Baker et al. 2013) , ואני גם ממליץ לקרוא את הפרשנות כי בעקבות הדו"ח המסכם.

עבור מטה-אנליזה על השפעת השקלול לצמצם הטיה בדגימות בלתי סבירות, ראה טבלה 2.4 ב Tourangeau, Conrad, and Couper (2013) , אשר מוביל את החוקרים למסקנה "התאמות נראות תיקונים שימושיים אבל לטעות. . . "

  • איך לשאול (סעיף 3.5)

Conrad and Schober (2008) מספק נפח נערך תחת הכותרת חזון ראיון סקר של העתיד, וזה כתובות רבות של נושאים בסעיף זה. Couper (2011) מתייחס נושאים דומים, ואת Schober et al. (2015) מציע דוגמא יפה של איך שיטות איסוף נתונים מותאמות הגדרה חדשה יכולות לגרום נתונים באיכות גבוהות יותר.

לקבלת דוגמה מעניינת אחרת של שימוש באפליקציות פייסבוק עבור סקרים מדעי החברה, ראה Bail (2015) .

לקבלת עצות נוספות על ביצוע סקרי חוויה מהנה ובעלת ערך למשתתפים, לראות את העבודה על שיטת תכנון המותאם (Dillman, Smyth, and Christian 2014) .

Stone et al. (2007) מציע טיפול אורך ספר של הערכה רגעית אקולוגית ושיטות חישוב לסקר.

  • סקרים צמודים נתונים אחרים (סעיף 3.6)

Judson (2007) תיאר את תהליך שילוב סקרים ונתונים מנהליים כמו "שילוב מידע," דן כמה יתרונות של גישה זו, ומציע כמה דוגמאות.

דרך נוספת כי חוקרים יכולים להשתמש עקבות דיגיטליות וקבצים מנהליים היא מסגרת דגימה לאנשים עם מאפיינים ספציפיים. עם זאת, לגשת רשומות אלה כדי לשמש מסגרת הדגימה ניתן גם ליצור שאלות הקשורות לפרטיות (Beskow, Sandler, and Weinberger 2006) .

לגבי מבקש מוגבר, גישה זו אינה חדשה כמו שזה עשוי להופיע מאיך שתיארתי אותה. לגישה הזאת יש קשרים עמוקים לשלושה שטחים גדולים במודל-סטטיסטיקה המבוססת שלאחר ריבוד (Little 1993) , זקיפה (Rubin 2004) , ואמידת שטח קטנה (Rao and Molina 2015) . כמו כן הוא קשור השימוש משתנה הפונדקאי במחקר רפואי (Pepe 1992) .

בנוסף סוגיות האתיות לגבי הגישה לנתוני עקבות הדיגיטליות, לשאול מוגבר גם יכול לשמש כדי להסיק תכונות רגישות שאנשים עלולים לא בוחרים לחשוף בסקר (Kosinski, Stillwell, and Graepel 2013) .

העלות והערכות זמן Blumenstock, Cadamuro, and On (2015) מתייחסות יותר למשתנת העלות-את עלות סקר-ונוסף אחד אינו כוללים עלויות קבועות כגון העלות לנקות ולעבד את נתוני שיחה. באופן כללי, לשאול מוגבר כנראה שעלותן גבוהה עלויות קבועות ומשתנות נמוכות דומות ניסויים דיגיטליים (ראה פרק 4). עוד פרטים על הנתונים המשמשים Blumenstock, Cadamuro, and On (2015) נייר נמצאים Blumenstock and Eagle (2010) ו Blumenstock and Eagle (2012) . בפניות imputuation המרובה (Rubin 2004) עשויות לעזור ודאות ללכוד באומדנים מלשאול מוגבר. אם חוקרי עשייה מוגברים מבקשים רק אכפת ספירות מצטברות, ולא תכונות ברמת פרט, אז גישות King and Lu (2008) ו Hopkins and King (2010) עשויות להיות שימושיות. למידע נוסף אודות גישות הלמידה מכונה ב Blumenstock, Cadamuro, and On (2015) , ראה James et al. (2013) (יותר מבוא) או Hastie, Tibshirani, and Friedman (2009) (מתקדם יותר). עוד ספר לימוד למידת מכונה הפופולרי הוא Murphy (2012) .

לגבי מבקש מועשר, התוצאות אנסולבהר ורש (2012) ציירו על שני שלבים עיקריים: 1) את היכולת של Catalist לשלב מקורות נתונים שונים רבים לייצר datafile מאסטר מדויק 2) היכולת של Catalist לקשר נתוני הסקר כדי datafile אדוניו. לכן, אנסולבהר ורש לבדוק כל אחד פעולות אלה בזהירות.

כדי ליצור את המאסטר datafile, Catalist המשלבת בהרמונית מידע ממקורות רבים ושונים, כולל: תמונות רשומות הצבעה מרובות מכל מדינה, נתונים מהשינוי הלאומי של משרד הדואר של רישום כתובת, ונתוני מספקי מסחרי שלא פורטו אחרות. את הפרטים העסיסיים על איך כל זה ניקוי והמיזוג קורים הם מעבר להיקף של ספר זה, אך תהליך זה, לא משנה כמה זהיר, יהיה להפיץ שגיאות במקורות הנתונים המקוריים יכיר שגיאות. למרות Catalist היה מוכן לדון עיבוד הנתונים שלה ולספק חלק מנתוני הגלם שלה, זה היה פשוט בלתי אפשרי עבור חוקרים לבחון מחדש את צינור נתוני Catalist כולו. במקום זאת, החוקרים היו במצב בו קובץ נתוני Catalist היה כמה ידוע, ואולי ניתן לידיעה, סכום של שגיאה. זוהי דאגה רצינית כי מבקר אולי לשער כי ההבדלים הגדולים בין בדוחות המדידות על CCES ואת ההתנהגות בקובץ נתוני אב Catalist נגרמו על ידי טעויות בקובץ נתוני אב, לא על ידי דיווחים שגויים על ידי משיבים.

אנסולבהר ורש לקחו שתי גישות שונות לטיפול חשש איכות נתונים. ראשית, בנוסף השוואת הצבעת דיווח עצמית כדי הצבעת הקובץ הראשי Catalist, החוקרים השוו גם דיווח עצמי מפלגה, גזע, מצב רישום בוחר (למשל, רשום או לא רשומה) ושיטת הצבעה (למשל, באופן אישי, נפקד בהצבעה, וכו ') לערכים אלה שנמצאו במאגרי מידע Catalist. במשך ארבעת אלה משתנים דמוגרפיים, מצאו חוקרי רמות גבוהות יותר של ההסכם בין דוח סקר ונתונים בקובץ מאסטר Catalist מאשר להצבעה. לפיכך, קובץ נתוני אב Catalist יש כנראה מידע באיכות גבוהה עבור תכונות מלבד הצבעה, דבר המעיד על כך אינו באיכות הכוללת העניים. שנית, בין שאר תוך שימוש בנתונים מ Catalist, אנסולבהר ורש פתחו שלושה מדדים שונים של איכות רשומה הצבעת מחוז, והם מצאו כי השיעור המוערך של יותר מ-דיווח של הצבעה היה בעצם קשור לשום מדדי איכות נתונים אלה, ממצא מראה כי שיעורי יתר הדיווח הגבוהים אינם מונעים על ידי מחוזות עם איכות נתונים נמוכה מרגיל.

בהתחשב יצירת קובץ הצבעה המאסטר הזה, המקור השני של שגיאות פוטנציאליות הוא קישור רשום סקר אליו. לדוגמא, אם הקשר הזה הוא נעשה בצורה לא נכון זה עלול להוביל אומדן חזק על ההבדל בין התנהגות הצבעה דיווחה ומאומתת (Neter, Maynes, and Ramanathan 1965) . אם כל אדם היה מזהה יציב, ייחודי זה היה בשני מקורות הנתונים, אז ההצמדה תהיה טריוויאלי. בארצות הברית ורוב מדינות אחרות, לעומת זאת, אין מזהה אוניברסלי. יתר על כן, גם אם היו כאלה אנשים מזהים כנראה יהיו מהסס לספק אותו סקר חוקרים! לפיכך, Catalist היה צריך לעשות את ההצמדה באמצעות מזהים מושלמים, במקרה זה ארבע פיסות מידע על כל מרואיין: שם, מין, שנת לידה, וכתובת המגורים. לדוגמה, היה Catalist להחליט אם סימפסון אח J ב CCES היה אותו אדם כמו הומר ג'יי סימפסון בקובץ הנתונים אדונם. בפועל, התאמה היא תהליך קשה מבולגן, ואת, כדי להחמיר את המצב עבור החוקרים, Catalist נחשב טכניקת ההתאמה שלה להיות קניינים.

על מנת לאמת את אלגוריתמי ההתאמה, הם הסתמכו על שני אתגרים. ראשית, Catalist השתתף בתחרות התאמה שנוהלה על ידי צד שלישי בלתי תלוי,: תאגיד מיטרה. MITRE ספק את כל המשתתפים שני קבצי נתונים רועשים שיותאם, וצוותות שונים התחרו לחזור MITRE ההתאמה הטובה ביותר. בגלל MITRE עצמו הכיר את ההתאמה הנכונה הם הצליחו להבקיע את הצוותים. מבין 40 חברות שהתמודדו, Catalist הגיעה למקום השני. סוג זה של הערכה עצמאית, צד שלישי של טכנולוגית קניינית הוא די נדיר ובעל ערך להפליא; הוא אמור לתת לנו ביטחון כי הליכי ההתאמה של Catalist הם בעצם על המדינה- of-the-art. אבל הוא המדינה- of-the-art מספיק טוב? בנוסף לתחרות התאמה זה, אנסולבהר ורש נוצרו אתגר התאמה משלהם Catalist. מתוך פרויקט קודם לכן, אנסולבהר ורש אספו רשום בוחר מפלורידה. הם סיפקו כמה רשומות אלה עם כמה בתחומם redacted כדי Catalist ולאחר מכן בהשוואה לדיווחי Catalist של שדות אלה לערכים שלהם בפועל. למרבה המזל, הדוחות של Catalist היו קרובים לערכים המנוכים, המציין כי Catalist יכול להתאים רשום בוחר חלקית על קובץ נתוני אדונם. אתגרים אלה שני, אחד על ידי צד-השלישית ואחד ידי אנסולבהר ורש, תנו לנו אמון רב יותר על האלגוריתמים של התאמת Catalist, למרות שאנחנו לא יכולים לבדוק את היישום המדויק שלהם עצמו.

היו ניסיונות קודמים רבים כדי לאמת הצבעה. לסקירה כללית של הספרות, ראה Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , ו Hanmer, Banks, and White (2014) .

חשוב לציין כי אם כי במקרה זה החוקרים עודדו את איכות נתוני Catalist, הערכות אחרות של ספקים מסחריים היו פחות נלהבים. חוקרים מצאו באיכות ירודה כאשר נתונים מסקרים לקובץ צרכן מקבוצת מערכות שיווק (שבעצמו התמזג יחד נתונים משלושה ספקים: Acxiom, Experian, ו InfoUSA) (Pasek et al. 2014) . כלומר, קובץ הנתונים לא התאים תגובות לסקר שחוקרים צפויים להיות נכון, datafile היה חסרי נתונים עבור מספר רב של שאלות, ואת תבנית נתונים החסרות היה מתואם לשווי סקר דיווח (כלומר הנתונים החסרים היו שיטתיים , לא אקראי).

למידע נוסף על קישור בין סקרים ונתונים מנהליים, לראות Sakshaug and Kreuter (2012) ו Schnell (2013) . למידע נוסף על קישור בכלל, לראות Dunn (1946) ו Fellegi and Sunter (1969) (ההיסטורי) ו Larsen and Winkler (2014) (המודרני). גישות דומות גם פותחו במדעי המחשב תחת שמות כגון מניעת כפילויות נתונים, זיהוי למשל, התאמת שם, איתור כפולים, לשכפל זיהוי שיא (Elmagarmid, Ipeirotis, and Verykios 2007) . ישנם גם הפרטיות שמירה גישות להקליט הצמדה אשר אינם דורשים את העברת פרטים אישיים מזהים (Schnell 2013) . חוקר פייסבוק פתח נוהל לקשר הרשום שלהם probabilisticsly הצבעת ההתנהגות (Jones et al. 2013) ; הצמדה זה נעשה כדי להעריך ניסוי שאני אספר לך על בפרק 4 (Bond et al. 2012) .

דוגמא נוספת לקשר סקר חברתי בקנה מידה גדולה ממשלה הרשומה המנהלי באה מן סקר מצב בריאות פרישת המוסד לביטוח הלאומי. למידע נוסף על המחקר, כולל מידע על הליך הסכמה, לראות Olson (1996) ו Olson (1999) .

התהליך של שילוב מקורות רבים של רשומות המנהליות לתוך מאסטר datafile-תהליך Catalist עובד-נפוץ המשרדים הסטטיסטיים של כמה ממשלות לאומיות. שני חוקרים משבדיה סטטיסטיקות כתבו ספר מפורט על הנושא (Wallgren and Wallgren 2007) . דוגמא לגישה זו מחוז יחיד בארצות הברית (מחוז אולמסטד, מינסוטה; ביתו של מרפאת מאיו), ראה Sauver et al. (2011) . למידע נוסף על שגיאות שיכולות להופיע ברשומות מינהלי, לראות Groen (2012) .