3.6.1 Amplified לשאול

קישור הסקר שלך עקבות דיגיטליות יכול להיות כמו לשאול את כולם השאלות שלך בכל העת.

מבוקש מגיע בדרך כלל בשני תחומים עיקריים: סקרים מדגמיים ואת המפקדים. סקרים מדגמיים, שבו אתה לגשת מספר קטן של אנשים, יכולים להיות גמישים, בזמן, וזולים יחסית. עם זאת, סקרים מדגמיים, משום שהם מבוססים על מדגם, מוגבלים בדרך כלל בהחלטה שלהם; עם סקר מדגמי, היא לעתים קרובות קשה לבצע הערכות לגבי אזורים גיאוגרפיים מסוימים או לקבוצות דמוגרפיות ספציפיות. מפקדים, מאידך גיסא, מנסים לראיין כולם באוכלוסייה. יש להם רזולוציה גדולה, אבל הם בדרך כלל יקרים, צר בפוקוס (שהן יכללו רק מספר קטן של שאלות), ולא בזמן (שהם קורים על פי לוח זמנים קבוע, כגון כל 10 שנים) (Kish 1979) . עכשיו דמיינו אם החוקרים יכלו לשלב את המאפיינים הטובים ביותר של סקרים מדגמיים ו מפקדים; לדמיין אם החוקרים יכלו לשאול כל שאלה לכולם כל יום.

ברור, מתמשך זה, בכל מקום, תמיד על הסקר הוא סוג של פנטזיה מדעי החברה. אבל, נראה כי אנו יכולים להתחיל להתקרב זו על ידי שילוב שאלות סקר ממספר קטן של אנשים עם עקבות דיגיטליות מאנשים רבים. אני קורא את זה סוג של שילוב מוגבר לשאול. אם נעשה היטב, זה יכול לעזור לנו מספק אומדן כי הם יותר מקומיים (עבור אזורים גיאוגרפיים קטנים), יותר פרטני (עבור קבוצות דמוגרפיות ספציפיות), ועוד בזמן.

דוגמא אחת לשאול מוגברים מגיעה מהעבודה של יהושע Blumenstock, שרץ לאסוף נתונים אשר יסייעו בפיתוח מדריך במדינות עניות. באופן ספציפי יותר, Blumenstock רצה ליצור מערכת למדוד עושר ורווחה ששילב את השלמות של מפקד עם גמישות ותדירות סקר (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . למעשה, כבר תיארתי עבודת Blumenstock בקצרה בפרק 1.

כדי להתחיל, Blumenstock שותפות עם ספק הסלולר הגדול ברואנדה. החברה ספקה לו רשומות עסקה אנונימיים שאנחנו מקבלים כ -1.5 מיליון לקוחות מכסי התנהגות משנת 2005 ו -2009 היומנים המכילים מידע על כל הודעת קריאה וטקסט כגון שעת ההתחלה, משך ומיקום גיאוגרפי משוער של המתקשר והמקלט. לפני שנתחיל לדבר על הבעיות הסטטיסטיות, זה שווה וציין כי צעד ראשון זה עשוי להיות אחד הקשים ביותר. כפי שתואר בפרק 2, רוב נתוני עקבות הדיגיטליים אינם נגישים לחוקרים. וגם, חברות רבות מהססות בצדק לשתף את הנתונים שלהם, כיוון שהוא פרטי; כי הוא ללקוחותיהם כנראה לא ציפו כי הרשומות שלהם תשותפנה-בתפזורת-עם חוקרים. במקרה זה, החוקרים לקחו בצעדים זהירים כדי לאנונימי הנתונים ועבודתם מפקחת על ידי (כלומר, IRB שלהם) צד שלישי. אבל, למרות מאמצים אלה, נתונים אלה הם ככל הנראה עדיין ניתן לזהות והם סביר להכיל מידע רגיש (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . אחזיר לשאלה האתית אלה בפרק 6.

נזכיר כי Blumenstock התעניין במדידת עושר ורווחה. אבל, תכונות אלו הן לא ישירות רשומות שיחות. במילים אחרות, רשומות שיחה אלה אינם שלמים למחקר זה, תכונה משותפת של עקבות דיגיטליים נדונה בהרחבה בפרק 2. אבל, סביר להניח כי רשומות שיחה כנראה יש קצת מידע על עושר ורווחה. אז, דרך אחת לשאול את שאלת Blumenstock יכולה להיות: האם אפשר לחזות כיצד מישהו יגיב סקר המבוסס על נתוני העקבות הדיגיטליים שלהם? אם כן, אז על ידי שואל כמה אנשים אנחנו יכולים לנחש את התשובות של כולם.

כדי להעריך את זה באופן אמפירי, Blumenstock ועוזרי מחקר מ קיגאלי מכון מדע וטכנולוגיה בשם מדגם של כאלף לקוחות טלפון ניידים. החוקרים הסבירו את המטרות של הפרויקט בפני המשתתפים, ביקש את הסכמתם לקשר את תוצאות הסקר על רשומות שיחה, ולאחר מכן ביקש מהם סדרה של שאלות כדי למדוד את עושרם ורווחה, כגון "האם אתה בעל רדיו? "ו" האם אתה בעלים של אופניים? "(ראה איור 3.11 עבור רשימה חלקית). כל המשתתפים בסקר פוצה כלכלי.

לאחר מכן, Blumenstock השתמש בהליך בן שני שלבים נפוצים מדע נתונים: הנדסת תכונה ואחריו למידה בפיקוח. ראשית, בשלב הנדסת תכונה, לכולם כי התראיין, Blumenstock להמיר את רשומות שיחות לתוך מערכת של מאפיינים על כל אדם; מדענים נתונים שאפשר לכנות מאפיינים אלה "תכונות" ומדענים חברתיים יקראו להם "משתנה." לדוגמה, עבור כל אדם, Blumenstock מחושב סך כל ימי פעילות, מספר אנשים ברורים אדם כבר במגע עם, הסכום כסף שהוצא על זמן אוויר, וכן הלאה. האנושות, הנדסת תכונה טובה דורשת ידע של מערך המחקר. לדוגמה, אם זה חשוב להבחין בין שיחות מקומיות ובינלאומיות (היינו מצפים אנשים שקוראים בינלאומית להיות עשירים), אז זה חייב להיעשות על צעד הנדסה תכונה. חוקר עם הבנה קטנה של רואנדה אולי לא כולל את התכונה הזו, ולאחר מכן את ביצועי הניבוי של המודל יסבלו.

לאחר מכן, בשלב למידה בפיקוח, Blumenstock נבנה מודל סטטיסטי כדי לחזות את תגובת הסקר עבור כל אדם על סמך התכונות שלהם. במקרה זה, Blumenstock בשימוש רגרסיה לוגיסטית עם פי 10-אימות הצלב, אבל הוא היה יכול להשתמש במגוון של גישות למידה סטטיסטית או מכונה אחרת.

אז כמה טוב זה עבד? היה Blumenstock מסוגל לחזות תשובות לסקר שאלות כמו "האם אתה בעלים של רדיו?" ו "האם אתה בעלים של אופניים?" שימוש בתכונות נגזרות רשומות שיחות? בערך. הדיוק של התחזיות היו גבוה עבור תכונות מסוימות (איור 3.11). אבל, זה תמיד חשוב להשוות שיטה לניבוי מורכבת נגד חלופה פשוטה. במקרה זה, חלופה פשוטה היא לחזות שכולם יתנו את התשובה הנפוצה ביותר. לדוגמא, 97.3% דיווחו על בעלות על רדיו כך שאם Blumenstock שחזה שכולם ידווחו בעלות על רדיו היה עליו ברמת דיוק של 97.3%, אשר באופן מפתיע דומה בביצוע הנוהל שלו מורכב יותר (דיוק 97.6%). במילות אחרות, כל הנתונים המפוארים והדגימה הגדילו את הדיוק של החיזוי מתוך 97.3% ל 97.6%. עם זאת, עבור שאלות אחרות, כגון "האם אתה בעלים של אופניים?", התחזיות השתפרו מ 54.4% ל 67.6%. באופן כללי יותר, לראות בתרשים 3.12 עבור כמה תכונות Blumenstock לא שפרה הרבה ממש מעבר שהופך את התחזית הבסיסית פשוט, אבל זה עבור תכונות אחרות היה שיפור מסוים.

איור 3.11: דיוק חזוי עבור מודל סטטיסטי מאומן עם רשומות שיחות. תוצאות מטבלה 2 של Blumenstock (2014).

איור 3.11: דיוק חזוי עבור מודל סטטיסטי מאומן עם רשומות שיחות. תוצאות מטבלה 2 של Blumenstock (2014) .

איור 3.12: השוואה בין דיוק חזוי עבור מודל סטטיסטי מאומן עם רשומות שיחת תחזית בסיסית פשוטה. נקודות בעצבנות מעט כדי למנוע חפיפה; ראה טבלה 2 של Blumenstock (2014) עבור ערכים מדויקים.

איור 3.12: השוואה בין דיוק חזוי עבור מודל סטטיסטי מאומן עם רשומות שיחת תחזית בסיסית פשוטה. נקודות בעצבנות מעט כדי למנוע חפיפה; ראה טבלה 2 של Blumenstock (2014) עבור ערכים מדויקים.

בשלב זה אתה עשוי לחשוב כי תוצאות אלה הם קצת מאכזב, אבל רק שנה אחת מאוחר יותר, Blumenstock ושני עמיתים-גבריאל Cadamuro ורוברט מתורגמן שפורסם בכתב העת Science מאמר עם תוצאות טובות יותר באופן משמעותי (Blumenstock, Cadamuro, and On 2015) . היו לכך שתי סיבות טכניות עיקריות לשיפור: 1) הם השתמשו בשיטות מתוחכמות יותר (כלומר, גישה חדשה תכונת הנדסת מודל למידה מכונה משוכלל יותר) ו -2) במקום לנסות להסיק תשובות לשאלות סקר בודדות (למשל, "האם אתה הבעלים של רדיו?"), הם ניסו להסיק מדד עושר מרוכבים.

Blumenstock ועמיתיו הדגימו את הביצועים של הגישה שלהם בשתי דרכים. ראשית, הם מצאו כי עבור האנשים במדגם שלהם, הם יכולים לעשות עבודה טובה למדי של חיזוי עושרם מרשומות שיחה (איור 3.14). שנית, נצחים ויותר מכך, Blumenstock ועמיתיו הראו כי ההליך שלהם יכול לייצר אומדנים באיכות גבוהה של פיזור גאוגרפי של עושר ברואנדה. באופן ספציפי יותר, הם השתמשו במודל למידת המכונה שלהם, אשר הוכשר על המדגם שלהם של כ -1,000 בני אדם, כדי לחזות את העושר של כל 1.5 מיליון בני האדם ברשומות השיחה. יתר על כן, עם הנתונים גיאו-מרחביים מוטבעים שיחת נתונים (לזכור כי נתוני השיחה כוללים את מיקומו של מגדל התא הקרוב עבור כל שיחה), החוקרים הצליחו להעריך את המקום המשוער של מגורים כנגד כל אדם. חיבור של שני אלה ערכות יחד, מחקר אח אומדן הפיזור הגאוגרפי של עושר מנוי ב גרעיניות מרחבית עדינה ביותר. לדוגמא, הם יכולים להעריך את העושר הממוצע בכל אחד 2148 התאים של רואנדה (ביחידה המנהלית הקטנה בארץ). הערכים עושר תחזיות אלה היו כה מפורטים הם היו קשים לבדוק. אז, החוקרים מצטברים התוצאות שלהם לייצר אומדנים של העושר הממוצע של 30 המחוזות של רואנדה. הערכות מחוז ברמה אלה היו קשורים מאוד האומדנים מסקרים מסורתי תקן זהב, הסקר הדמוגרפי והבריאותי ברואנדה (איור 3.14). למרות ההערכות משני המקורות היו דומות, האומדנים מ Blumenstock ועמיתיו היו כ -50 פעמים זולות יותר ו -10 פעמים מהר (כאשר העלות נמדדה במונחים של עלויות משתנות). ירידה דרמטית זו בעלות משמעות דבר הוא שבמקום מתנהל אחת לכמה שנים-כמקובל דמוגרפי והבריאותיים סקרים-ההיברידי של סקר קטן בשילוב עם נתוני עקבות דיגיטליים גדולים יכול להיות לרוץ מדי חודש.

איור 3.13: סכמטי של Blumenstock, Cadamuro ו- On (2015). נתוני שיחה מחברת הטלפון הוסבו מטריצה ​​עם שורה אחת עבור כל אדם עמודה אחת לכל תכונה (למשל, משתנה). בשלב הבא, החוקרים בנו מודל למידה בפיקוח לחזות את תוצאות הסקר מהאדם ידי מטריקס תכונה. לאחר מכן, המודל למידה בפיקוח שמש לזקיפת תגובות הסקר לכולם. בעיקרו של דבר, החוקרים השתמשו בתגובות של כאלף אנשים לזקוף העושר של כמיליון איש. כמו כן, החוקרים העריכו את המקום המשוער של מגורים עבור כל 1.5 מיליון אנשים על סמך מיקומם של השיחות שלהם. כאשר שני אומדנים אלה אוחדו-העושר המוערך והמקום המשוער של המגורים-והתוצאות היו דומים להערכות מן דמוגרפיים סקר בריאות, סקר מסורתי תקן זהב (איור 3.14).

איור 3.13: סכמטי של Blumenstock, Cadamuro, and On (2015) . נתוני שיחה מחברת הטלפון הוסבו מטריצה ​​עם שורה אחת עבור כל אדם עמודה אחת לכל תכונה (כלומר, משתנה). בשלב הבא, החוקרים בנו מודל למידה בפיקוח לחזות את תוצאות הסקר מהאדם ידי מטריקס תכונה. לאחר מכן, המודל למידה בפיקוח שמש לזקיפת תגובות הסקר לכולם. בעיקרו של דבר, החוקרים השתמשו בתגובות של כאלף אנשים לזקוף העושר של כמיליון איש. כמו כן, החוקרים העריכו את המקום המשוער של מגורים עבור כל 1.5 מיליון אנשים על סמך מיקומם של השיחות שלהם. כאשר שני אומדנים אלה אוחדו-העושר המוערך והמקום המשוער של המגורים-והתוצאות היו דומים להערכות מן דמוגרפיים סקר בריאות, סקר מסורתי תקן זהב (איור 3.14).

איור 3.14: תוצאות Blumenstock, Cadamuro ו- On (2015). ברמת הפרט, החוקרים הצליחו לעשות עבודה סבירה בחיזוי העושר של מישהו מרשומות קריאתם. האומדנים של עושר חסר-אשר המחוז ברמה התבססו על הערכות ברמת פרט של עושר ומקום המגורים-התוצאות היו דומים לתוצאות המסקרות הדמוגרפי והבריאותי, סקר מסורתי תקן זהב.

איור 3.14: תוצאות Blumenstock, Cadamuro, and On (2015) . ברמת הפרט, החוקרים הצליחו לעשות עבודה סבירה בחיזוי העושר של מישהו מרשומות קריאתם. האומדנים של עושר חסר-אשר המחוז ברמה התבססו על הערכות ברמת פרט של עושר ומקום המגורים-התוצאות היו דומים לתוצאות המסקרות הדמוגרפי והבריאותי, סקר מסורתי תקן זהב.

לסיכום, Blumenstock של מוגבר לשאול נתוני סקר בשילוב גישה עם נתוני עקבות דיגיטליים לייצר הערכות ניתן להשוות אומדני סקר תקן זהב. דוגמא מסוימת זה גם מבהירה כמה הפשרות בין מבוקש המוגבר ושיטות סקר מסורתיות. ראשית, ההערכות לשאול המוגברות היו יותר בזמן, באופן משמעותי יותר זולים, ויותר פרטניים. אבל, מצד שני, בשלב זה, אין בסיס תיאורטי חזק עבור סוג זה של המבוקש מוגבר. כלומר, דוגמא אחת זה לא מראה כשזה יעבוד ומתי זה לא יהיה. יתר על כן, הגישה המבוקשת המוגברת עדיין אין דרכים טובות לכמת ודאות סביב הערכותיה. עם זאת, מבקש מוגבר יש קשרים עמוקים לשלושה שטחים גדולים בסטטיסטיקה-מודל מבוסס שלאחר ריבוד (Little 1993) , זקיפת (Rubin 2004) , ואמידת-שטח קטן (Rao and Molina 2015) -ואז אז אני מצפה כי ההתקדמות להיות מהיר.

שואל מוגבר כדלקמן מתכון בסיסי שיכול להיות מותאם למצב הספציפי שלך. ישנם שני מרכיבים ושני צעדים. שני החומרים הם 1) במערך עקבות דיגיטליים הוא רחב אבל רזה (כלומר, יש לו הרבה אנשים אבל לא את המידע שאתה צריך על כל נפשות) 2) סקר כי הוא צר אבל עבה (כלומר, יש לו רק אנשים מעטים, אבל יש לו את המידע הדרוש לך על האנשים האלה). לאחר מכן, יש שני שלבים. ראשית, עבור אנשים בשני מקורות מידע, לבנות מודל למידת מכונה המשתמשת נתונים עקבות דיגיטליים לחזות תשובות הסקר. לאחר מכן, השתמש מודל למידה מכונית לזקוף את התשובות בסקר של כולם בנתוני העקבות הדיגיטליים. לכן, אם יש איזה שאלה שאתה רוצה לשאול עם הרבה אנשים, לחפש נתוני עקבות דיגיטליים מאנשים אלה שעלולים לשמש כדי לחזות את תשובתם.

השוואת הניסיון הראשון ושני של Blumenstock את הבעיה גם מדגימה שיעור חשוב על המעבר מעידן שני לגישות בעידן שלישיות ולחקר דעת קהל: בהתחלה היא לא הסוף. כלומר, הרבה פעמים, הגישה הראשונה לא יהיה הכי טוב, אבל אם החוקרים ממשיכים עבודה, דברים יכולים להשתפר. באופן כללי יותר, כאשר אנו מעריכים גישות חדשות המחקר חברתי בעידן הדיגיטלי, חשוב לעשות בשתי הערכות נפרדות: 1) כמה טוב זה עובד עכשיו 2) כמה טוב אתה חושב שזה יכול לעבוד בעתיד כמו נוף הנתונים שינויים כחוקרים להקדיש יותר תשומת לב לבעיה. אמנם, חוקרים מאומנים לבצע את הסוג הראשון של הערכה (כמה טוב הוא פיסה המסוימת הזה של מחקר), השני הוא בדרך כלל חשוב יותר.