5.4.3 Zaključek

Porazdeljeno zbiranje podatkov je možno in v prihodnosti bo verjetno vključevalo tehnologijo in pasivno udeležbo.

Kot kaže eBird, se lahko porazdeljeno zbiranje podatkov uporabi za znanstvene raziskave. Poleg tega PhotoCity kaže, da so težave, povezane z vzorčenjem in kakovostjo podatkov, potencialno rešljive. Kako bi lahko razdeljevali zbiranje podatkov za socialne raziskave? Eden od primerov izhaja iz dela Suzan Watkins in njenih kolegov o projektu Malawi Journals (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . V tem projektu je 22 lokalnih prebivalcev - »novinarjev« - »razpravljalnih revij«, ki so podrobno zabeležile pogovore, ki so jih slišali o aidsu v vsakdanjem življenju navadnih ljudi (v času, ko se je projekt začel, približno 15% odraslih v Malaviju so okuženi z virusom HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Ti novinarji so zaradi svojega statusa vstopa lahko poslušali pogovore, ki so bili Watkinsu in njenim zahodnim raziskovalnim sodelavcem nedostopni (razpravljam o etiki tega kasneje v poglavju, ko ponudim nasvete o oblikovanju lastnega projekta množičnega sodelovanja) . Podatki iz projekta Malawi Journals so pripeljali do številnih pomembnih ugotovitev. Na primer, pred začetkom projekta so mnogi zunanji sodelavci verjeli, da je prišlo do tišine o aidsu v podsaharski Afriki, vendar so pogovorne revije pokazale, da to očitno ni bilo tako: novinarji so na stotine razprav o tej temi slišali na različnih lokacijah pogrebi, bari in cerkve. Poleg tega je narava teh pogovorov pomagala raziskovalcem boljše razumevanje nekaterih odpornosti proti uporabi kondomov; način uporabe kondomov v sporočilih javnega zdravja je bil v neskladju z načinom, kako se je razpravljalo v vsakdanjem življenju (Tavory and Swidler 2009) .

Seveda, kot podatki iz eBird, podatki iz projekta Malawi Journals niso popolni, o čemer je Watkins in sodelavke podrobno obravnavala. Zabeleženi pogovori na primer niso naključni vzorec vseh možnih pogovorov. Namesto tega so nepopolni popis pogovorov o aidsu. Glede kakovosti podatkov so raziskovalci menili, da so njihovi novinarji visokokakovostni novinarji, kar dokazuje skladnost v revijah in v revijah. To pomeni, da je bilo dovolj novinarjev razporejenih v dovolj majhni obliki in osredotočeno na določeno temo, je bilo mogoče uporabiti odpuščanje za oceno in zagotavljanje kakovosti podatkov. Na primer, spolni delavec z imenom "Stella" se je večkrat pojavil v revijah štirih različnih novinarjev (Watkins and Swidler 2009) . Da bi nadgradili svojo intuicijo, tabela 5.3 prikazuje druge primere zbiranja porazdeljenih podatkov za družbene raziskave.

Tabela 5.3: Primeri projektov zbiranja porazdeljenih podatkov v družbenih raziskavah
Zbrani podatki Referenca
Razprave o HIV / aidsu v Malaviju Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015)
Street prosil v Londonu Purdam (2014)
Konfliktni dogodki v vzhodnem Kongu Windt and Humphreys (2016)
Gospodarska dejavnost v Nigeriji in Liberiji Blumenstock, Keleher, and Reisinger (2016)
Nadzor gripe Noort et al. (2015)

Vsi primeri, opisani v tem razdelku, so vključevali dejavno udeležbo: novinarji so prepisali pogovore, ki so jih slišali; ptiči so naložili kontrolne sezname ptic; ali igralci naložili svoje fotografije. Kaj pa, če je bila udeležba avtomatična in ni zahtevala nobene posebne spretnosti ali časa za oddajo? To je obljuba, ki jo ponuja »participativno zaznavanje« ali »zaznavanje ljudi«. Na primer, Pothole Patrol, projekt znanstvenikov iz MIT-a, je v sedmih taksijskih kabinah na območju Bostona namestil GPS-opremljene merilnike pospeševanja (Eriksson et al. 2008) . Ker vožnja preko luknje pusti poseben signal merilnika pospeška, lahko te naprave, če so nameščene znotraj gibajočih taksijev, ustvarijo zemljevide iz Bostona. Seveda taksiji naključno ne vzorčijo cest, vendar je ob zadostnih taksijah mogoče zadostno pokrivati ​​informacije o velikih delih mesta. Druga prednost pasivnih sistemov, ki se zanašajo na tehnologijo, je, da prepuščajo proces prispevka podatkov: medtem ko zahteva spretnost, da prispeva k eBird (ker morate biti sposobni zanesljivo identificirati vrste ptic), ne potrebuje posebnih veščin prispevajo k Pothole Patrolu.

Pojdiva naprej, verjamem, da bo veliko projektov zbiranja podatkov o porazdeljenih podatkih začelo uporabljati zmogljivosti mobilnih telefonov, ki jih že prenašajo milijarde ljudi po vsem svetu. Ti telefoni že imajo veliko število senzorjev, pomembnih za merjenje, kot so mikrofoni, kamere, GPS naprave in ure. Nadalje podpirajo aplikacije tretjih oseb, ki raziskovalcem omogočajo nadzor nad osnovnimi protokoli za zbiranje podatkov. Končno imajo internetno povezljivost, ki jim omogoča, da prenašajo podatke, ki jih zbirajo. Obstajajo številni tehnični izzivi, od nenatančnih senzorjev do omejenega trajanja baterije, vendar se bodo te težave s časom verjetno zmanjšale, ko se bo tehnologija razvila. Po drugi strani pa lahko vprašanja, povezana z zasebnostjo in etiko, postanejo bolj zapletena; Vrnil se bom na etična vprašanja, ko bom ponudil nasvete o oblikovanju lastnega množičnega sodelovanja.

Pri distribucijskih projektih zbiranja podatkov prostovoljci prispevajo podatke o svetu. Ta pristop je bil že uspešno uporabljen, verjetno pa bo treba v prihodnje uporabiti vprašanja za vzorčenje in kakovost podatkov. Na srečo obstoječi projekti, kot sta PhotoCity in Pothole Patrol, predlagata rešitve teh težav. Ker več projektov izkorišča tehnologijo, ki omogoča ne usposobljeno in pasivno udeležbo, bi morali porazdeljeni projekti zbiranja podatkov dramatično povečati, kar bi raziskovalcem omogočilo zbiranje podatkov, ki so bili v preteklosti preprosto omejeni.