3.4.3 דגימות ללא הסתברות: התאמת מדגם

התרגום הזו נוצר על ידי מחשב. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.3 דגימות ללא הסתברות: התאמת מדגם

לא כל הדגימות הלא ההסתברות זהות. אנחנו יכולים להוסיף שליטה רבה יותר על הקצה הקדמי.

הגישה וואנג ועמיתיו השתמשו כדי להעריך את תוצאות הבחירות בארה"ב 2012 לנשיאות היו תלויה מאוד שיפורים בניתוח נתונים. כלומר, הם אספו כמו תגובות רבות ככל שיכלו ולאחר מכן ניסו לשחזר את המשקל אותם. אסטרטגיה משלימה לעבודה עם לדגימה שאינה ההסתברות היא לקבל יותר שליטה על תהליך איסוף הנתונים.

הדוגמא הפשוטה ביותר של תהליך דגימה הלא הסתברות נשלט חלקית היא דגימת מכסה, טכניקה שהולכת אחורה אל הימים הראשונים של מחקר סקר. בדגימות מכסה, חוקרים מחלקים את האוכלוסייה לקבוצות שונות (למשל, צעיר, צעיר, וכו ') ולאחר מכן מכסה סט עבור מספר האנשים להיבחר בכל קבוצה. המשיבים נבחרו באופן אקראי עד החוקר נפגש המכסה שלהם בכל קבוצה. בגלל המכסות, המדגם וכתוצאה מכך נראה יותר כמו אוכלוסיית היעד מ יהיה נכון אחרת, אלא בגלל ההסתברויות של הכללה אינן ידועות חוקרים רבים ספקנים של דגימה מכסה. למעשה, דגימת מכסה הייתה גורם "דיואי תבוסות טרומן" שגיאה בסקרים לנשיאות ארה"ב 1948. מכיוון שהוא מספק שליטה מסוימת על תהליך הדגימה, לעומת זאת, אפשר לראות איך דגימת מכסה אולי יש כמה יתרונות על פני אוסף נתונים בלתי מבוקר לחלוטין.

הזזה מעבר דגימת מכסה, גישות מודרניות יותר לשליטה על תהליך הדגימה הלא הסתברות כעת אפשריות. גישה אחת כזו נקראת התאמת מדגם, והוא משמש על ידי כמה ספקי לוח מקוון מסחרי. בצורתו הפשוטה ביותר, התאמת מדגם דורשת שני מקורות נתונים: 1) פנקס שלם של האוכלוסייה ו -2) פנל גדול של מתנדבים. חשוב כי המתנדבים לא צריך להיות מדגם הסתברותי מכל האוכלוסייה; אין להדגיש כי ישנן דרישות לבחירה לתוך הלוח, אקרא לו פנל מלוכלך. כמו כן, הוא במרשם האוכלוסין ואת הלוח המלוכלך חייבים לכלול כמה מידע עזר על כל אדם, בדוגמא זו, אשקול גיל ומין, אך במצבים מציאותיים מידע עזר זה יכול להיות הרבה יותר מפורט. הטריק של התאמת מדגם הוא לבחור דגימות מתוך פנל מלוכלך בצורה שמייצרת דגימות שנראות כמו דגימות הסתברות.

התאמת לדוגמא מתחיל כאשר מדגם הסתברותי מדומה נלקח מתוך במרשם האוכלוסין; מדגם מדומה זה הופך מדגם יעד. לאחר מכן, על סמך המידע עזר, מקרים במדגם היעד מותאמים לאנשים בלוח המלוכלך כדי ליצור מדגם תואם. לדוגמא, אם יש נקבה בת 25 שנה במדגם היעד, ואז החוקר מוצא נקבה 25 בת המלוח המלוכלך להיות במדגם המתאים. לבסוף, חברי המדגם התואם מתראיינים לייצר במערכה האחרונה של משיבים.

למרות המדגם התואם נראה כמו מדגם היעד, חשוב לזכור כי המדגם התואם אינו מדגם הסתברותי. דגימות מותאמות יכולות להתאים מדגם היעד רק על המידע עזר הידוע (למשל, גיל ומין), אבל לא על מאפיינים באופן שאינו ניתן למדידה. לדוגמא, אם אנשים בלוח המלוכלך נוטים להיות עני-אחרי הכל, אחת סיבות להצטרף פנל סקר הוא להרוויח כסף-אז גם אם המדגם התואם נראה כמו מדגם היעד מבחינת גיל ומין זה עדיין יהיה הטיה כלפי אנשים עניים. הקסם של דגימת הסתברות אמיתית הוא לשלול בעיות משתי מאפיינים נמדדו באופן שאינו ניתן למדידה (נקודה העולה בקנה אחד עם בדיוננו התאמה עבור היסק סיבתי ממחקרים תצפיתיים בפרק 2).

בפועל, התאמת מדגם תלוי שיש פאנל גדול ומגוון להוט להשלים סקרים, וכך זה נעשה בעיקר על ידי חברות שיכולות להרשות לעצמם לפתח ולשמר פאנל כזה. כמו כן, בפועל, לא יכולים להיות בעיות עם התאמה (לפעמים התאמה טובה עבור מישהו במדגם היעד אינו קיימים בלוח) ו-היענות (לפעמים אנשים במדגם המתאים מסרבים להשתתף בסקר). לכן, בפועל, חוקרים עושים התאמת מדגם גם לבצע איזושהי התאמה שלאחר ריבוד לבצע הערכות.

קשה לספק ערבויות תיאורטיות שימושיות על התאמת מדגם, אך בפועל הוא יכול לבצע היטב. לדוגמא, סטיבן אנסולבהר ובריאן שפנר (2014) לעומת שלושה סקרים מקבילים של כ -1,000 אנשים שנערכו בשנת 2010 באמצעות שלוש דגימה שונה וראיונות שיטות: שירותי דואר, טלפון, וכן פנל לאינטרנט באמצעות התאמת מדגם וכוונון-ריבוד פוסט. האומדנים מהשלוש הגישות היו די דומים הערכות של מבחני ביצועים איכותיים כמו סקר האוכלוסייה השוטף (CPS) ואת ראיון הבריאות הממלכתית סקר (Nhis). באופן ספציפי יותר, הוא הסקרים באינטרנט ודואר היו כבויים בשיעור ממוצע של 3 נקודות אחוז בסקר הטלפון היה כבוי ב -4 נקודות אחוז. שגיאות גדולות זה הן כ מה שניתן היה לצפות מן הדגימות של כ -1,000 אנשים. אמנם, אף אחד מהמצבים אלה מיוצרים נתונים טובים יותר באופן משמעותי, הוא בסקר האינטרנט וטלפון (אשר לקח ימים או שבועות) היו מהיר יותר באופן משמעותי לתחום מאשר בסקר האלקטרוני (אשר לקח שמונה חודשים), ואת הסקר באינטרנט, אשר ממשמש התאמת מדגם, היה זול יותר מאשר שני מצבים אחרים.

לסיכום, מדענים וסטטיסטיקאים חברתיים ספקנים מאוד של היקשים מדגימים הלא הסתברות אלה, בין שאר משום שהם קשורים עם כמה כשלים מביכים של סקרי דעת קהל כגון סקר התקציר הספרותי. בין שאר, אני מסכים עם ספקנות זו: דגימות הלא הסתברות לא מותאמות צפויות לייצר אומדנים רעים. עם זאת, אם חוקרים יכולים להתאים עבור ההטיות בתהליך הדגימה (למשל, פוסט-ריבוד) או לשלוט בתהליך הדגימה מעט (למשל, התאמת מדגם), הם יכולים לייצר הערכות טובות יותר, ואף ערכות של איכות מספיק לרוב מטרות. כמובן, זה יהיה יותר טוב לעשות דגימת הסתברות להורג בצורה מושלמת, אבל זה כבר לא נראה אופציה ריאלית.

דגימות הן דגימות הסתברות הלא הסתברות להשתנות באיכותם, וכיום סביר להניח במקרה שרוב ההערכות ממדגם הסתברות הם אמינות יותר מאשר הערכות ממדגמים הלא הסתברות. אבל, אפילו עכשיו, הערכות ממדגמים הלא הסתברות היטב שנערכים הן כנראה טובות יותר מאשר הערכות ממדגם הסתברות גרועה שנערכו. יתר על כן, דגימות הלא הסתברות זולות באופן משמעותי. לפיכך, נראה כי ההסתברות vs לדגימה שאינה ההסתברות מציעה עלות באיכות trade-off (איור 3.6). במבט קדימה, אני מצפה כי הערכות ממדגמים הלא הסתברות עשויה היטב תהיינה זולות יותר וטוב יותר. יתר על כן, בגלל ההתמוטטות בסקרי טלפון הקווה ושיעורי גוברת של אי-שבה, אני מצפה כי דגימות הסתברויות תהיינה יותר יקרות באיכות נמוכה יותר. בשל מגמות לטווח ארוכות אלה, אני חושב לדגימה שאינה הסתברות תהפוך חשובה יותר ויותר בעידן השלישי של מחקר סקר.

איור 3.6: דגימת הסתברות בפועל והדגימה הלא הסתברות הן קטגוריות גדולות, הטרוגניות. באופן כללי, יש trade-off שגיאה בעלות עם לדגימה שאינה הסתברות להיות בעלות נמוכה אבל שגיאה גבוהה. עם זאת, עשויה היטב לדגימה שאינה הסתברות יכולה לייצר הערכות טובות יותר מאשר דגימת הסתברות גרועה לעשות. בעתיד, אני מצפה כי הדגימה הלא הסתברות תקבל טובה יותר וזולה יותר בעוד דגימת הסתברות תחמיר ויותר יקר.