5.4.3 סיכום

איסוף נתונים מבוזר אפשרי, ובעתיד זה עשוי להיות כרוך בטכנולוגיה ובהשתתפות פסיבית.

כמו eBird מדגים, נתונים מבוזרים איסוף ניתן להשתמש במחקר מדעי. יתר על כן, PhotoCity מראה כי בעיות הקשורות הדגימה ואיכות הנתונים הם פוטנציאל לפתרון. כיצד ניתן לחלק את איסוף הנתונים למחקר חברתי? דוגמה אחת נובעת מעבודתה של סוזן ווטקינס ועמיתיה על פרויקט כתבי העת (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . בפרויקט הזה, 22 תושבים מקומיים - שנקראו "עיתונאים" - "כתבי עת", אשר רשמו בפירוט את השיחות ששמעו על איידס בחיי היומיום של אנשים רגילים (בזמן שהפרויקט החל, כ -15% מהמבוגרים ב Malawi היו נגועים ב- HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). בגלל מצבם הפנימי, יכלו העיתונאים האלה לשמוע את השיחות שאולי לא היו נגישות אל ווטקינס ואל שותפיה למחקר מערבי (אני אדון באתיקה של זה בהמשך הפרק, כאשר אני מציע עצה על תכנון פרויקט שיתוף הפעולה ההמוני שלך) . הנתונים ממחקר "מלאווי" הובילו למספר ממצאים חשובים. לדוגמה, לפני תחילת הפרויקט, רבים מבחוץ האמינו כי יש שתיקה על איידס באפריקה שמדרום לסהרה, אבל כתבי העת הדגימו כי זה בהחלט לא המקרה: עיתונאים שמעו מאות דיונים בנושא, במקומות מגוונים כמו הלוויות, ברים וכנסיות. יתר על כן, אופי השיחות הללו סייע לחוקרים להבין טוב יותר את ההתנגדות לשימוש בקונדום; האופן בו נעשה שימוש בקונדום במסגרות בריאות הציבור לא היה עולה בקנה אחד עם האופן שבו הוא נדון בחיי היומיום (Tavory and Swidler 2009) .

כמובן, כמו הנתונים של eBird, הנתונים של פרויקט כתבי העת מלאווי אינם מושלמים, נושא שנדון בפירוט על ידי ווטקינס ועמיתיו. לדוגמה, השיחות המוקלטות אינן מדגם אקראי של כל השיחות האפשריות. במקום זאת, הם מפקד בלתי שלם של שיחות על איידס. מבחינת איכות הנתונים, החוקרים האמינו שהעיתונאים שלהם הם כתבים איכותיים, כפי שמעידים העקביות בכתבי עת ובכתבי עת. כלומר, בגלל מספיק עיתונאים נפרסו בסביבה קטנה מספיק התמקדו בנושא מסוים, אפשר היה להשתמש יתירות להעריך ולהבטיח את איכות הנתונים. לדוגמה, עובדת מין בשם "סטלה" הופיע פעמים אחדות בכתבי עת של ארבעה עיתונאים שונים (Watkins and Swidler 2009) . כדי להמשיך לבנות את האינטואיציה שלך, טבלה 5.3 מציגה דוגמאות אחרות של איסוף נתונים מבוזרים למחקר חברתי.

לוח 5.3: דוגמאות לפרויקטים של איסוף נתונים מבוזרים במחקרים חברתיים
מידע נאסף התייחסות
דיונים על HIV / איידס במלאווי Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015)
רחוב מתחנן בלונדון Purdam (2014)
אירועי קונפליקט במזרח קונגו Windt and Humphreys (2016)
פעילות כלכלית בניגריה ובליבריה Blumenstock, Keleher, and Reisinger (2016)
מעקב שפעת Noort et al. (2015)

כל הדוגמאות המתוארות בסעיף זה היו כרוכות בהשתתפות פעילה: עיתונאים העבירו שיחות ששמעו; ציפורים העלו את רשימות הציפורים שלהם; או שחקנים שהעלו את התמונות שלהם. אבל מה אם ההשתתפות היתה אוטומטית ולא דורשת מיומנות מסוימת או זמן להגיש? זוהי ההבטחה המוצעת על ידי "חישה משתתפת" או "חישה ממוקדת-אנשים". לדוגמה, סיירת הבורות, פרויקט של מדענים ב- MIT, רכבה תאוצה מאופיינת ב- GPS בתוך שבע מוניות מוניות באזור בוסטון (Eriksson et al. 2008) . בגלל נהיגה מעל מהמורה משאיר אות accelerometer מובהק, התקנים אלה, כאשר ממוקם בתוך מוניות נעים, יכול ליצור מפות מבול של בוסטון. כמובן, המוניות לא מדגם כבישים אקראיים, אבל, בהתחשב מספיק המוניות, ייתכן שיהיה כיסוי מספיק כדי לספק מידע על חלקים גדולים של העיר. יתרון שני של מערכות פאסיביות המסתמכות על הטכנולוגיה הוא שהן אינן מיישמות את התהליך של תרומת נתונים: בעוד שהיא דורשת מיומנות לתרום ל- eBird (מכיוון שאתה צריך להיות מסוגל לזהות באופן אמין סוגי ציפורים), זה לא דורש מיומנויות מיוחדות כדי לתרום פטרול סיור.

במבט קדימה, אני חושד כי פרויקטים רבים של איסוף נתונים מבוזרים יתחילו לנצל את היכולות של הטלפונים הניידים המבוצעים כבר על ידי מיליארדי אנשים ברחבי העולם. טלפונים אלה כבר יש מספר רב של חיישנים חשוב למדידה, כגון מיקרופונים, מצלמות, מכשירי GPS, שעונים. בנוסף, הם תומכים ביישומים של צד שלישי המאפשרים לחוקרים שליטה מסוימת על הפרוטוקולים לאיסוף נתונים. לבסוף, יש להם קישוריות לאינטרנט, מה שמאפשר להם לטעון את הנתונים שהם אוספים. ישנם אתגרים טכניים רבים, החל חיישנים לא מדויקים לחיי סוללה מוגבל, אבל בעיות אלה יקטן ככל הנראה עם הזמן כמו הטכנולוגיה מתפתחת. סוגיות הקשורות בפרטיות ואתיקה, לעומת זאת, עשויות להיות מסובכות יותר; אני אחזור לשאלות של אתיקה כאשר אני מציע עצה על תכנון שיתוף פעולה המוני שלך.

בפרויקטים של איסוף נתונים מבוזרים, מתנדבים תורמים נתונים על העולם. גישה זו כבר נוצלה בהצלחה, ושימושים עתידיים צפויים להיתקל בבעיות הדגימה ואיכות הנתונים. למרבה המזל, פרויקטים קיימים כגון PhotoCity ו- Pothole Patrol מציעים פתרונות לבעיות אלו. ככל שיותר פרויקטים מנצלים טכנולוגיה המאפשרת השתתפות לא-מקצועית ומיסיונרית, פרויקטים של איסוף נתונים מבוזרים צריכים להגדיל באופן דרמטי את קנה המידה שלהם, ומאפשר לחוקרים לאסוף נתונים שהיו פשוט מחוץ לתחום בעבר.