5.4.3 Заключение

Разпределени събиране на данни е възможно, и за в бъдеще вероятно ще включва технология и пасивно участие.

Както показва eBird, разпределени събирането на данни може да се използва за научни изследвания. Освен това, PhotoCity показва, че проблемите, свързани с вземане на проби и качеството на данните са потенциално решими.

Как може да разпределя работата за събиране на данни за социални изследвания? Един чудесен пример идва от работата на Сюзън Уоткинс и колегите й от списания проект Малави (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . В този проект, 22 местни жители наречените "журналисти" -kept "разговорен списания", които записват, в детайли, разговорите те дочули за СПИН в ежедневието на обикновените хора (по време на проекта са започнали, около 15% от възрастните в Малави са били заразени с вируса на СПИН (Bello, Chipeta, and Aberle-Grasse 2006) ). Поради своята вътрешна статус, тези журналисти са били в състояние да чуе разговорите, които може да са били недостъпни за Сюзън Уоткинс и нейните западни научни сътрудници (аз ще обсъди етиката на това по-късно в главата, когато се предлагат съвети за проектиране на вашия собствен проект маса сътрудничество ). Данните от проекта Малави Journals е довело до редица важни открития. Например, преди стартирането на проекта, много външни хора вярват, че настана мълчание за СПИН в Африка на юг от Сахара, но списанията показват, че това е ясно не е така: журналисти дочути стотици разговор по темата, на места, толкова разнообразни, колкото погребения , барове, и църкви. Освен това, естеството на тези разговори помогнаха на изследователите по-добре да разберат някои от съпротивата срещу употребата на презервативи; начинът, по който презерватив употреба е в рамка в съобщенията за общественото здраве е в противоречие с начина, по който го бе обсъден във всекидневния живот (Tavory and Swidler 2009) .

Разбира се, като данните от eBird, данните от списания проект Малави не е съвършен, въпрос, обсъден подробно от Уоткинс и колеги. Например, записаните разговори не са случайна извадка от всички възможни разговори. По-скоро те са непълни преброяване на разговори за СПИН. По отношение на качеството на данните, изследователите смятат, че техните журналисти са висококачествени репортери, както е видно от съгласуваността в рамките на списания и в цяла списания. Освен това, когато достатъчно журналисти са разположени в една достатъчно малка настройка и доклади са фокусирани върху определена тема, съкращения стана възможно, което увеличава доверието в качеството на данните. Например, една проститутка на име "Стела" се появи няколко пъти в дневниците на четири различни журналисти (Watkins and Swidler 2009) . Както беше в PhotoCity, използването на съкращения е важен принцип за оценяване и гарантиране на качеството на данни в разпределени проекти за събиране на данни. С цел по-нататъшно изграждане на интуицията си, Таблица 5.3 показва други примери за разпределени за събиране на данни за социални изследвания.

Таблица 5.3: Примери за разпределени проекти за събиране на данни в социалните изследвания.
събраните данни цитат
Дискусиите за ХИВ / СПИН в Малави Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015)
Улица просия в Лондон Purdam (2014)
Конфликти събития в Източно Конго Windt and Humphreys (2016)
Икономическата активност в Нигерия и Либерия Blumenstock, Keleher, and Reisinger (2016)
надзор на грипа Noort et al. (2015)

Всички примери, описани в този раздел са включени активно участие: журналисти преписват разговори, че те чуват; Birders качените си Птиците контролни листове; или играчи, качени на техните снимки. Но какво, ако участието е автоматична и не изисква никакви специфични умения или време, за да представи? Това е обещанието, предлагани от "засичане на участието" или "хора, ориентирани наблюдение." Например, в дупка патрул, проект на учени от Масачузетския технологичен институт, монтирани GPS оборудвани акселерометри вътре седем таксита в района на Бостън (Eriksson et al. 2008) . Заради шофиране над дупка оставя обособен акселерометър сигнал, тези устройства, когато е поставен вътре на движещи се таксита, може да се създаде дупка карти на Бостън. Разбира се, таксита не случайно опитат пътища, но като се има достатъчно таксита, може да има достатъчно покритие, за да се предостави информация за големи части от тях град. Втората полза на пасивни системи, които разчитат на технологията е, че те де-умения в процеса на допринасяйки данни: докато тя изисква умение да допринесе за eBird (защото трябва да бъде в състояние надеждно да идентифицират вида птици), тя не изисква специални умения за допринесе за дупка Patrol.

Занапред, аз подозирам, че проекти за събиране на много разпространени данни ще започнат да се възползват от възможностите на мобилните телефони, които вече са извършени от милиарди хора по целия свят. Тези телефони вече имат голям брой сензори важни за измерване, като микрофони, камери, GPS устройства, както и часовници. Освен това, тези мобилни телефони поддържат приложения на трети страни, които позволяват на изследователите някакъв контрол върху основните протоколи за събиране на данни. И накрая, тези телефони имат интернет-свързаност, което прави възможно за тях да се разтоварите данните, които те събират. Има много технически предизвикателства от неточни сензори за ограничен живот на батерията, но тези проблеми вероятно ще намалеят с течение на времето, както се развива технология. Въпроси, свързани с неприкосновеността на личния живот и етика, от друга страна, може да получат по-сложни от развитието на технологиите; Ще се върне към въпроса за етиката, когато предложи съвети за проектиране на вашия собствен маса сътрудничество.

В разпределени проекти за събиране на данни, доброволци допринасят данни за света. Този подход вече е била използвана успешно, и бъдещите нужди вероятно ще трябва да отговори на загрижеността за вземане на проби и за качество на данните. За щастие, съществуващи проекти като PhotoCity и дупка Patrol предполагат решения на тези проблеми. Тъй като все повече проекти да се възползват от технологията, която позволява де-квалифицирана и пасивно участие, разпределени проекти за събиране на данни трябва драстично увеличение в мащаб, даде възможност на изследователите да се съберат данни, че е просто извън граници в миналото.