3.3.1 ייצוג

ייצוג הוא לגבי ביצוע היקשים מן המשיבים שלך לקהל היעד שלך.

על מנת להבין את הסוג של שגיאות שיכולות לקרות כאשר הסיקו מן המשיבים לאוכלוסייה הגדולה יותר, הבה נבחנו את סקר קש Digest הספרותי שניסה לחזות את תוצאות הבחירות לנשיאות ארה"ב 1936. למרות שזה היה לפני יותר 75 שנה, הכישלון הזה עדיין יש לקח חשוב ללמד חוקרים היום.

תקציר ספרותי היה מגזין כללי-עניין פופולרי, החל בשנת 1920 הם התחילו לרוץ סקרים קש לחזות את התוצאות של הבחירות לנשיאות. כדי להפוך תחזיות אלו הם ישלחו פתקי הצבעה עם הרבה אנשים, ואז פשוט לחשב את פתקי ההצבעה שהוחזרו; הספרותית Digest דיווחה בגאווה כי פתקי ההצבעה שקבלו היו "משוקללת, מותאם, ולא פרש." הליך זה בצורה נכונה שחזו את הזוכה הבחירות ב -1920, 1924, 1928 ו 1932. בשנת 1936, בעיצומו של השפל הגדול, התקציר ספרותי שלח פתקים עד 10 מיליון בני אדם, ששמותיהם הגיעו ברובה מן מדריכי טלפון ורשומים רישיון רכב. הנה איך הם תיארו המתודולוגיה שלהם:

"מהלכי מכונת החלקה שבתוכניות לעכל עם הדיוק המהיר של ניסיון שלושים שנה כדי להפחית ניחושים לעובדות קשות. . . .זה השבוע 500 עטים שתלשו יותר מרבע מ'כתובות ביום. כל יום, בחדר גדול גבוה מעל השדרה הרביעית קשור בסרטים מנועים, בניו יורק, 400 עובדים בזריזות להחליק למ' חתיכות של חומר מודפס-מספיק כדי לסלול ארבעים רחובות-אל העיר את העוטפת התייחסה [כך במקור]. כל שעה, ב משנה דואר תקציר חדשות עצמו, שלושה היה מקשקשים מכונה מדידת דואר חותמת את בפסים האלכסוניים הלבנים; עובדי דואר מיומנים והשליכו אותם לתוך בולטות mailsacks; הצי לעכל משאיות האיצו אותם להביע רכבות אלקטרוניות. . . בשבוע הבא, את התשובות הראשונות עשר מיליוני האלה תתחלנה הגאות הנכנס פתקים ניכרים, להיות משולש בדק, מאומת, חמש פעמים צולבות מסווג והסתכם. כשהדמות האחרון כבר סיכמה ובדק, אם ניסיון העבר הוא קריטריון, המדינה תדע בתוך שבריר 1 אחוז מקולות הבוחרים בפועל של ארבעים מיליון [הבוחרים]. "(22 באוגוסט, 1936)

הפטישיזם של גודל של Digest הוא לזיהוי מיידי לכל חוקר "נתונים גדולים" היום. של 10 מיליון פתקי ההצבעה להפיץ, מדהימים 2.4 מיליון פתקים הוחזרו-זה בערך 1,000 גדול פי סקרים פוליטיים מודרניים. מתוך 2.4 מיליון משיבי פסק הדין היה ברור: Literary Digest חזה כי המתמודד אלף לנדון הולך להביס את רוזוולט פרנקלין המכהן. אבל, למעשה, ההפך הגמור קרה. רוזוולט ניצח את לנדון במפולת. איך יכול Digest הספרותי להשתבש עם כל כך הרבה נתונים? ההבנה של דגימה המודרנית שלנו עושה הטעויות של הספרותי Digest ברורה ועוזרת לנו להימנע מביצוע טעויות דומות בעתיד.

לחשוב בבהירות על דגימה מחייב אותנו לשקול ארבע קבוצות שונות של אנשים (איור 3.1). הקבוצה הראשונה של אנשים היא אוכלוסיית היעד; זוהי הקבוצה כי המחקר מגדיר כמו אוכלוסיית עניין. במקרה של Digest הספרותי אוכלוסיית היעד הייתה הבוחרים בבחירות לנשיאות 1936. לאחר שיחליט על אוכלוסיית יעד, חוקר הבא צריך לפתח רשימה של אנשים שיכולים לשמש דגימה. רשימה זו נקראת מסגרת דגימה לבין האוכלוסייה על מסגרת הדגימה נקראת אוכלוסיית המסגרת. במקרה של Digest הספרותי אוכלוסיית המסגרת היא 10 מיליון בני האדם ששמותיהם הגיעו ברובה מן מדריכי טלפון ורשומים רישיון רכב. באופן אידיאלי אוכלוסיית היעד לבין אוכלוסיית המסגרת תהיה בדיוק אותו הדבר, אבל בפועל מדובר לעתים קרובות לא המקרה. הבדלים בין אוכלוסיית יעד אוכלוסיית מסגרת נקראים שגיאת כיסוי. שגיאה סיקור אינו, כשלעצמו מבטיח בעיות. אבל, אם האנשים באוכלוסיית המסגרת שונים באופן שיטתי מאנשים לא באוכלוסיית המסגרת תהיה הטית כיסוי. שגיאת סיקור הייתה הראשון מבין הפגמים הגדולים עם סקר התקציר הספרותי. הם רצו ללמוד על בוחרים-כי היו שלהם יעד אוכלוסייה-אבל הם בנו מסגרת דגימה ברובה מספרי טלפון מרשמי רכב, מקורות כי ייצוג יתר עשיר אמריקאים שהיו יותר עשוי לתמוך אלף לנדון (כזכור, בשתי הטכנולוגיות הללו, אשר הם הנפוצים כיום, היו חדשים יחסית בזמן וכי ארה"ב הייתה בעיצומו של השפל הגדול).

איור 3.1: שגיאות ייצוג.

איור 3.1: שגיאות ייצוג.

לאחר הגדרת אוכלוסיית המסגרת, הצעד הבא הוא עבור חוקר כדי לבחור את אוכלוסיית המדגם; אלה אנשים שהחוקרים ינסו לראיין. אם המדגם יש מאפיינים שונים מאשר באוכלוסיית המסגרת, אז אנחנו יכולים להציג את טעות דגימה. זהו סוג של שגיאה לכמת את מרחב הטעות שמלווה בדרך כלל את ההערכות. במקרה של הפיאסקו Digest הספרותי, שם למעשה לא היה מדגם; הם ניסו ליצור קשר עם כולם באוכלוסיית המסגרת. למרות שאין טעות דגימה, היה ברור עדיין שגיאה. מבהיר כי בשולי שגיאות המדווחים בדרך כלל עם הערכות מסקרות הם בדרך כלל קטנים מטעה; הם אינם כוללים את כל מקורות שגיאה.

לבסוף, חוקר מנסה לראיין את כולם אוכלוסיית המדגם. אלה אנשים מתראיינים בהצלחה נקראים משיבים. באופן אידיאלי, אוכלוסיית המדגם לבין המשיבים יהיה בדיוק אותו הדבר, אך בפועל קיימת אי-השבה. כלומר, אנשים שנבחרו במדגם לסרב להשתתף. אם אנשים מגיבים שונים מאלה שאינם מגיבים, אז יכול להיות הטיה בלתי התגובה. הטיה Non-ההיענות היתה הבעיה העיקרית השנייה עם סקר תקציר ספרותי. רק 24% מהאנשים שקיבלו פתק הגיב, והתברר כי אנשים שתמכו לנדון היו בסבירות גבוהה יותר להגיב.

מעבר פשוט להיות דוגמא להציג את הרעיונות של ייצוג, סקר Digest הספרותי הוא משל חוזרת ונשנית, מזהיר החוקרים על הסכנות של דגימה אקראית. למרבה הצער, אני חושב שהלקח שהרבה אנשים לצייר מהסיפור הזה הוא שגוי. מוסר ההשכל הנפוץ ביותר של הסיפור הוא כי חוקרים לא יכולים ללמוד שום דבר ממדגמים הלא הסתברות (כלומר, דגימות ללא כללים מבוססי הסתברות קפדנים לבחירת משתתפים). אבל, כפי שאני אראה בהמשך פרק זה, זה לא לגמרי בסדר. במקום זאת, אני חושב שיש באמת שני מוסר לסיפור הזה; מוסר כי נכונים היום כפי שהיו בשנת 1936. ראשית, כמות גדולה של נתונים שנאספו באקראי לא תבטיח הערכה טובה. שנית, חוקרים צריכים לתת דין וחשבון על אופן שבו נתוניהם נאספו כאשר הם עושים ערכות ממנו. במילים אחרות, כי את תהליך איסוף הנתונים בסקר ספרותי Digest היה מוטה באופן שיטתי כלפי חלק מהמשיבים, החוקרים צריכים להשתמש בתהליך הערכה מורכבת יותר המשקלל כמה מהמשיבים יותר מאחרים. בהמשך פרק זה, אני אראה לך אחד שקלול כזה הליך-פוסט-ריבוד-שיכול לאפשר לך לבצע הערכות טובות יותר דגימות בלתי סבירות.