5.4.3 Висновок

Можливе розподілене збору даних, і в майбутньому це, ймовірно, включатиме технологію та пасивну участь.

Як показує eBird, розподілений збір даних може бути використаний для наукових досліджень. Далі, PhotoCity показує, що проблеми, пов'язані з вибіркою та якістю даних, потенційно можуть бути вирішені. Як розподіл даних може працювати для соціальних досліджень? Один з прикладів - це робота Сьюзен Уоткінс та її колег з проекту "Малаві журнали" (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . У цьому проекті 22 місцеві жителі, що отримали назву "журналісти", мали "розмовні журнали", які детально записали розмови, які вони чули про СНІД в повсякденному житті звичайних людей (на момент початку проекту близько 15% дорослих) в Малаві були інфіковані ВІЛ (Bello, Chipeta, and Aberle-Grasse 2006) ). Через їх статус інсайдерів ці журналісти змогли послухати бесіди, які могли бути недоступними для Уоткіна та її західних дослідників (я обговорюватимемо етичність цього згодом у розділі, коли я пропоную поради щодо розробки власного проекту масової співпраці) . Дані з Проекту Малаві Журнали призвели до ряду важливих висновків. Наприклад, перед початком проекту багато хто з аутсайдерів вважали, що існує мовчання про СНІД в Африці на південь від Сахари, але розмовні журнали продемонстрували, що цього не було. Журналісти заслухали сотні обговорень теми, у різних місцях похорони, бари та церкви. Крім того, характер цих розмов допоміг дослідникам краще зрозуміти певну стійкість до використання презервативів; спосіб використання презервативів в повідомленнях громадського здоров'я був несумісний з тим, як це було обговорено в повсякденному житті (Tavory and Swidler 2009) .

Звичайно, як і дані з eBird, дані з Проекту Малаві Журнали не є досконалими, питання, детально обговорене Ваткінсом та його колегами. Наприклад, записані розмови не є випадковою вибіркою всіх можливих розмов. Скоріше, вони є неповною переписом розмов про СНІД. З точки зору якості інформації, дослідники вважали, що їх журналісти були високоякісними журналістами, про що свідчить узгодженість у журналах та журналах. Тобто, оскільки достатньо журналістів було розгорнуто в досить малій обстановці і зосереджено на певній темі, можна було використовувати резервування для оцінки та забезпечення якості даних. Наприклад, секс-працівник під назвою "Стелла" кілька разів з'явився в журналах чотирьох різних журналістів (Watkins and Swidler 2009) . Для подальшого вдосконалення своєї інтуїції в таблиці 5.3 показані інші приклади розподіленого збору даних для соціальних досліджень.

Таблиця 5.3: Приклади проектів розподіленого збору даних у соціальних дослідженнях
Дані зібрані Посилання
Обговорення проблеми ВІЛ / СНІД в Малаві Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015)
Вулиця благання в Лондоні Purdam (2014)
Конфліктні події у Східному Конго Windt and Humphreys (2016)
Економічна діяльність в Нігерії та Ліберії Blumenstock, Keleher, and Reisinger (2016)
Нагляд за грипом Noort et al. (2015)

Всі приклади, описані в цьому розділі, включали активну участь: журналісти переписали розмови, які вони чули; birders завантажили свої контрольні списки птахів; або гравці завантажили свої фотографії. Але що робити, якщо участь була автоматичною та не вимагала певних навичок або часу для подання? Це обіцянка, пропонована "зацікавленим відчуттям" або "орієнтацією на людину". Наприклад, Pothole Patrol, проект вчених MIT, встановив GPS-оснащені акселерометри всередині сім таксі в районі Бостона (Eriksson et al. 2008) Оскільки проїзд через порожнину залишає певний сигнал акселерометра, ці пристрої, розміщені всередині рухомого таксі, можуть створювати карликові карти Бостона. Звичайно, таксі не випадково підбирають дороги, але, якщо врахувати достатнє кількість таксі, може бути достатньо охоплення, щоб надати інформацію про велику частину міста. Друга перевага пасивних систем, які покладаються на технологію, полягає в тому, що вони набувають навичок процесу надання даних: хоча це вимагає вміння робити внесок у eBird (оскільки ви повинні бути в змозі надійно виявляти види птахів), це не вимагає спеціальних навичок внесок у Pothole Patrol.

Продовжуючи, я підозрюю, що багато проектів з розподіленими даними збиратимуться використовувати можливості мобільних телефонів, які вже переводять мільярди людей у ​​всьому світі. У цих телефонах вже є велика кількість сенсорів, важливих для вимірювання, таких як мікрофони, камери, GPS-пристрої та годинники. Крім того, вони підтримують сторонні програми, що дозволяють дослідникам контролювати основні протоколи збору даних. Нарешті, вони мають інтернет-з'єднання, що дозволяє їм відключати завантаження даних, які вони збирають. Існують численні технічні проблеми, починаючи від неточних датчиків до обмеженого терміну служби акумулятора, але з часом ці проблеми, ймовірно, зменшуться, коли технологія розвиватиметься. З іншого боку, питання, пов'язані з конфіденційністю та етикою, можуть стати ще більш складними; Я повернуся до питань етики, коли я пропоную поради щодо розробки власної масової співпраці.

У проектах з розподіленими даними добровольці надають дані про світ. Цей підхід вже успішно використовується, і в майбутньому це, ймовірно, буде стосуватися проблеми вибірки та якості даних. На щастя, існуючі проекти, такі як PhotoCity і Pothole Patrol, пропонують рішення цих проблем. Оскільки в більшій кількості проектів використовуються технології, що забезпечують участь у професійній та пасивній участі, проекти з розподіленими даними повинні значно збільшуватися в масштабі, що дає змогу дослідникам збирати дані, які раніше були обмеженими.