5.4.3 Konklusion

Distribueret dataindsamlingen er muligt og i fremtiden vil sandsynligvis indebære teknologi og passiv deltagelse.

Som eBird demonstrerer, kan distribueres dataindsamling bruges til videnskabelig forskning. Endvidere PhotoCity viser, at problemerne i forbindelse med prøvetagning og datakvalitet er potentielt løses.

Hvordan kan distribueret dataindsamling arbejde for social forskning? Et vidunderligt eksempel kommer fra arbejde Susan Watkins og hendes kolleger på Malawi Tidsskrifter Project (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . I dette projekt, 22 lokale beboere såkaldte "journalister" -kept "konversation tidsskrifter", der er optaget, i detaljer, de samtaler, de overhørte om aids i dagligdagen for almindelige mennesker (på det tidspunkt, at projektet begyndte, omkring 15% af voksne i Malawi blev smittet med hiv (Bello, Chipeta, and Aberle-Grasse 2006) ). På grund af deres insider status, disse journalister var i stand til at høre samtaler, der kunne have været utilgængelige for Susan Watkins og hendes vestlige forskning samarbejdspartnere (jeg vil diskutere etikken i dette senere i kapitlet, når jeg tilbyde rådgivning om at designe dit eget masse samarbejdsprojekt ). Dataene fra Malawi Tidsskrifter projektet har ført til en række vigtige resultater. For eksempel, før projektet startede, mange udenforstående mente, at der var tavshed om aids i Afrika syd for Sahara, men de tidsskrifter viste, at dette var klart ikke tilfældet: journalister overhørte hundredvis af samtale om emnet, på steder så forskellige som begravelser , barer og kirker. Endvidere arten af ​​disse samtaler hjulpet forskere bedre forstå nogle af modstanden mod brug af kondomer; den måde, at brug af kondom var indrammet i folkesundheden beskeder var uforenelig med den måde, at det blev drøftet i hverdagen (Tavory and Swidler 2009) .

Selvfølgelig, ligesom data fra eBird, data fra Malawi Tidsskrifter Project er ikke perfekt, et emne diskuteret i detaljer af Watkins og kolleger. For eksempel er de optagede samtaler er ikke en tilfældig stikprøve af alle mulige samtaler. De er snarere en ufuldstændig optælling af samtaler om AIDS. Med hensyn til datakvalitet, forskerne mener, at deres journalister var af høj kvalitet journalister, som det fremgår af sammenhængen i tidsskrifter og på tværs af tidsskrifter. Endvidere når nok journalister er indsat i en lille nok indstilling og rapporter er fokuseret på et bestemt emne, blev muligt redundans, hvilket øger tilliden til datakvaliteten. For eksempel, en prostitueret ved navn "Stella" dukkede op flere gange i tidsskrifter af fire forskellige journalister (Watkins and Swidler 2009) . Som det var i PhotoCity, brugen af redundans et vigtigt princip for vurdering og sikring af datakvalitet i distribuerede projekter op dataindsamling. For yderligere at opbygge din intuition, Tabel 5.3 viser andre eksempler på distribuerede dataindsamling for social forskning.

Tabel 5.3: Eksempler på distribuerede indsamling projekter data i social forskning.
data indsamlet Citation
Diskussioner om hiv / aids i Malawi Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015)
Street tigger i London Purdam (2014)
Konflikt begivenheder i det østlige Congo Windt and Humphreys (2016)
Den økonomiske aktivitet i Nigeria og Liberia Blumenstock, Keleher, and Reisinger (2016)
Influenza overvågning Noort et al. (2015)

Alle de, der er beskrevet i dette afsnit, eksempler har involveret aktiv deltagelse: journalister transskriberede samtaler, de hørte; birders uploadet deres Fugleopdræt tjeklister; eller spillere uploadet deres billeder. Men hvad nu, hvis deltagelsen var automatisk og ikke kræver nogen særlige færdigheder eller tid til at indsende? Dette er løftet, der tilbydes af "participatory sensing" eller "folk-centric sensing." For eksempel, den Pothole Patrol, et projekt af forskere ved MIT, monterede GPS udstyret accelerometre inde syv taxaer i Boston-området (Eriksson et al. 2008) . Fordi kørsel over en hul i vejen efterlader en tydelig accelerometer signal, disse enheder, når den er placeret inde i bevægelige taxier, kan skabe Pothole kort over Boston. Selvfølgelig gør taxier ikke tilfældigt prøve veje, men givet nok taxier, kan der være tilstrækkelig dækning til at give oplysninger om store dele af de byen. En anden fordel ved passive systemer, der er afhængige af teknologi er, at de de-færdighed processen med at bidrage data: mens det kræver dygtighed at bidrage til eBird (fordi du skal være i stand til pålideligt identificere fuglearter), det kræver ingen særlige færdigheder til bidrage til Pothole Patrol.

Fremadrettet Jeg formoder, at projekter indsamling mange distribuerede data vil begynde at gøre brug af mulighederne i mobiltelefoner, der allerede båret af milliarder af mennesker over hele verden. Disse telefoner har allerede et stort antal sensorer vigtige for måling, såsom mikrofoner, kameraer, GPS-enheder, og ure. Endvidere disse mobiltelefoner understøtter tredjeparts apps muliggør forskere en vis kontrol over de underliggende dataindsamling protokoller. Endelig disse telefoner har Internet-forbindelse, hvilket gør det muligt for dem at off-indlæse de data, de indsamler. Der er mange tekniske udfordringer fra unøjagtige sensorer til begrænset batteritid, men disse problemer vil sandsynligvis mindre med tiden, efterhånden som teknologien udvikler sig. Spørgsmål vedrørende privatlivets fred og etik, på den anden side, kan få mere kompliceret som teknologien udvikler sig; Jeg vil vende tilbage til spørgsmål om etik, når jeg tilbyde rådgivning om at designe dit eget masse samarbejde.

I distribuerede projekter dataindsamling, frivillige bidrager data om verden. Denne fremgangsmåde er allerede blevet anvendt med succes, og fremtidige anvendelser vil sandsynligvis nødt til at tage fat prøvetagning og datakvalitet bekymringer. Heldigvis eksisterende projekter såsom PhotoCity og Pothole Patrol foreslå løsninger på disse problemer. Efterhånden som flere projekter udnytter teknologi, der muliggør de kvalificerede og passiv deltagelse, distribueret dataindsamling projekter skal dramatisk stigning i skala, så forskerne til at indsamle data, der var simpelthen off grænser i fortiden.