5.4.3 Zaključek

Distributed zbiranje podatkov je mogoče, in v prihodnosti bo verjetno vključuje tehnologijo in pasivno udeležbo.

Kot kaže eBird, lahko razdeli zbiranje podatkov se uporabljajo za znanstvene raziskave. Poleg tega PhotoCity kaže, da so težave, povezane z vzorčenjem in kakovosti podatkov lahko rešljiva.

Kako lahko razdelijo delo zbiranja podatkov za socialne raziskave? Čudovit primer prihaja iz dela Susan Watkins in njenih sodelavcev na malavijske Journals projekta (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . V tem projektu, 22 lokalnih prebivalcev imenovanih "novinarji" -kept "pogovorne revijah", ki so beležili, podrobno, pogovori pa slišal o aidsu v vsakdanjem življenju navadnih ljudi (v času, ko je projekt začel, približno 15% odraslih v Malaviju so bili okuženi z virusom HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Zaradi njihovega statusa notranjih, so bili ti novinarji sposobni slišati pogovorov, ki bi lahko bile nedostopne Susan Watkins in njenih zahodnih raziskovalnih sodelavcev (bom razpravljali o etiki v tem kasneje v poglavju, ko sem ponujajo nasvete o oblikovanju svoje mase za sodelovanje projekt ). Podatki iz Malavi Journals projekta je privedlo do številnih pomembnih ugotovitev. Na primer, pred začetkom projekta, mnogi tujci verjeli, da je molk o aidsu v podsaharski Afriki, vendar revije pokazala, da je to očitno ne drži: novinarji slišal stotine pogovor na temo, na lokacijah, tako raznolika kot pogreb , bari, in cerkve. Nadalje narava teh pogovorov pomagala raziskovalci bolje razumeli nekatere odpornosti na uporabo kondomov; tako da je bil kondom uporaba umeščena v sporočilih za javno zdravje je bilo v nasprotju z načinom, ki je bil obravnavan v vsakdanjem življenju (Tavory and Swidler 2009) .

Seveda, kot so podatki iz eBird, podatki iz Malavija Journals projekta ni popolna, to vprašanje podrobneje razpravljali Watkins in kolegi. Na primer, posnetih pogovorov niso naključni vzorec vseh možnih pogovorov. Namesto, da so nepopolni popis pogovorov o aidsu. V smislu kakovosti podatkov, raziskovalci menijo, da so njihovi novinarji visokokakovostne novinarji, kot je razvidno iz doslednosti v revijah in po revijah. Nadalje, če so dovolj novinarji razporejeni v majhnem dovolj nastavitev in poročila se osredotoča na določeno temo, redundanca postalo mogoče, kar povečuje zaupanje v kakovost podatkov. Na primer, sex delavec imenovan "Stella" pojavil večkrat v revijah štirih različnih novinarjev (Watkins and Swidler 2009) . Kot je bilo v PhotoCity, uporaba redundance je pomembno načelo za ugotavljanje in zagotavljanje kakovosti podatkov v distribuiranih projektov zbiranja podatkov. Da bi nadgradili svojo intuicijo, Tabela 5.3 prikazuje druge primere porazdeljenih zbiranja podatkov za družbene raziskave.

Tabela 5.3: Primeri porazdeljenih projektov zbiranja podatkov v družboslovnega raziskovanja.
zbrani podatki Navedba
Razprave o HIV / AIDS v Malavi Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015)
Street beračenje v Londonu Purdam (2014)
Konfliktnih dogodkov v vzhodnem Kongu Windt and Humphreys (2016)
Gospodarska aktivnost v Nigeriji in Liberiji Blumenstock, Keleher, and Reisinger (2016)
nadzor gripe Noort et al. (2015)

Vsi primeri so opisani v tem poglavju so vključeni aktivno udeležbo: novinarji prepisovati pogovorov, ki so slišali; birders naložili svoje Opazovanje ptic kontrolnih seznamov; ali igralci naložili svoje fotografije. Kaj pa, če je bila udeležba samodejno in ne zahteva nobene posebne spretnosti ali časa, da predloži? To je obljuba, ki jo "participativni zaznavanjem" ali ponujena "ljudi osredotočene zaznavanja." Na primer, Jama Patrol, projekt, ki ga znanstveniki na MIT, vgrajena GPS opremljene pospeškov, znotraj sedmih taksi kabine v okolici Boston (Eriksson et al. 2008) . Ker je vožnja skozi Jama pusti poseben pospeška signala, te naprave, ko je nameščena v notranjosti, ki se gibljejo taksijev, lahko ustvarite Jama zemljevide Boston. Seveda, taksiji ne naključno vzorčenje ceste, vendar glede dovolj taksiji, je lahko zadostno kritje za zagotavljanje informacij o večjih deležih oni mesta. Druga prednost pasivne sisteme, ki temeljijo na tehnologiji je, da de-spretnost proces prispeva podatke: medtem ko je zahteva spretnost, da prispevajo k eBird (ker boste morali, da bi lahko zanesljivo prepoznati vrste ptic), da ne zahteva posebnih znanj za prispevajo k Jama Patrol.

Gremo naprej, sumim, da bodo projekti zbiranja mnogi porazdeljene podatke začeli uporabljati zmogljivosti mobilnih telefonov, ki so že izvedle več milijard ljudi po vsem svetu. Ti telefoni že imajo veliko število senzorjev, pomembnih za merjenje, kot so mikrofoni, kamere, GPS naprave in ure. Poleg tega ti mobilnih telefonov podpira aplikacije tretjih oseb, ki omogočajo raziskovalcem nekaj nadzora nad tem povezanih protokolov zbiranja podatkov. Končno, ti telefoni imajo internetno povezljivost, ki omogoča, da jim razbremenite podatkov, ki jih zbiramo. Obstajajo številne tehnične težave pri netočnih senzorjev omejeno življenjsko dobo baterije, vendar te težave bo verjetno zmanjšal sčasoma zaradi tehnološkega razvoja. Vprašanja v zvezi z zasebnostjo in etiko, na drugi strani pa bi dobili bolj zapleten zaradi tehnološkega razvoja; Bom vrnil na vprašanja etike, ko sem ponujajo nasvete o oblikovanju svoje množično sodelovanje.

V porazdeljenih projektov zbiranja podatkov, prostovoljci prispevali podatke o svetu. Ta pristop je bil že uspešno uporablja, in prihodnje uporabe bodo verjetno morali obravnavati vzorčenja in kakovost podatkov skrbi. Na srečo, obstoječi projekti, kot PhotoCity in Jama Patrol predlagati rešitve za te težave. Ker vedno več projektov izkoristijo tehnologijo, ki omogoča de kvalificirane in pasivno udeležbo, porazdeljeno projekti za zbiranje podatkov naj bi dramatično povečala v obsegu, ki omogoča raziskovalcem za zbiranje podatkov, ki je enostavno off meje v preteklosti.