5.4.3 Conclusione

La raccolta dei dati distribuiti è possibile, e in futuro sarà probabilmente coinvolgerà tecnologia e partecipazione passiva.

Come dimostra eBird, la raccolta dei dati distribuita può essere utilizzato per la ricerca scientifica. Inoltre, Photocity dimostra che i problemi relativi al campionamento e la qualità dei dati sono potenzialmente risolvibili.

Come potrebbe distribuito il lavoro di raccolta dei dati per la ricerca sociale? Un esempio meraviglioso proviene dal lavoro di Susan Watkins ei suoi colleghi sul Journals Project Malawi (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . In questo progetto, 22 locali residenti cosiddetti "giornalisti" -kept "riviste di conversazione", che hanno registrato, nel dettaglio, le conversazioni hanno sentito di AIDS nella vita quotidiana della gente comune (al momento il progetto è iniziato, circa il 15% degli adulti in Malawi sono stati infettati con HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). A causa del loro status di insider, questi giornalisti sono stati in grado di origliare le conversazioni che avrebbero potuto essere inaccessibili a Susan Watkins ei suoi collaboratori di ricerca occidentali (Parlerò l'etica di questo più avanti nel capitolo, quando offro consigli sulla progettare il proprio progetto di collaborazione di massa ). I dati del Project Malawi Riviste ha portato ad una serie di risultati importanti. Ad esempio, prima che il progetto è partito, molti stranieri hanno creduto che ci fu silenzio di AIDS in Africa sub-sahariana, ma le riviste hanno dimostrato che questo era chiaramente non è il caso: i giornalisti sentirono centinaia di conversazione sul tema, in luoghi diversi come i funerali , bar e chiese. Inoltre, la natura di queste conversazioni ha aiutato i ricercatori a comprendere meglio alcune delle resistenza a uso del condom; il modo in cui l'uso del preservativo è stato inquadrato nei messaggi di salute pubblica era in contrasto con il modo in cui se ne è parlato nella vita quotidiana (Tavory and Swidler 2009) .

Naturalmente, come i dati eBird, i dati del Journals Project Malawi non è perfetto, un problema discusso in dettaglio da Watkins e colleghi. Ad esempio, le conversazioni registrate non sono un campione casuale di tutti i possibili conversazioni. Piuttosto, sono un censimento incompleta di conversazioni su AIDS. In termini di qualità dei dati, i ricercatori ritengono che i loro giornalisti sono stati i giornalisti di alta qualità, come dimostra la coerenza riviste e attraverso riviste. Inoltre, quando un numero sufficiente di giornalisti vengono distribuiti in un piccolo ambiente abbastanza e le relazioni si concentrano su un argomento specifico, la ridondanza è diventato possibile, che aumenta la fiducia nella qualità dei dati. Ad esempio, un operaio del sesso chiamato "Stella" ha mostrato più volte nelle riviste di quattro diversi giornalisti (Watkins and Swidler 2009) . Come era nel Photocity, l'uso di ridondanza è un principio importante per valutare e garantire la qualità dei dati in progetti di raccolta dati distribuiti. Al fine di costruire ulteriormente la vostra intuizione, Tabella 5.3 mostra altri esempi di raccolta dati distribuiti per la ricerca sociale.

Tabella 5.3: Esempi di progetti di raccolta di dati distribuiti nella ricerca sociale.
I dati raccolti Citazione
Discussioni su HIV / AIDS in Malawi Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015)
Via accattonaggio a Londra Purdam (2014)
eventi conflitto nel Congo orientale Windt and Humphreys (2016)
L'attività economica in Nigeria e Liberia Blumenstock, Keleher, and Reisinger (2016)
sorveglianza dell'influenza Noort et al. (2015)

Tutti gli esempi descritti in questa sezione hanno coinvolto la partecipazione attiva: giornalisti trascritte le conversazioni che hanno sentito; ornitologi caricati i loro elenchi di controllo di birdwatching; o giocatori caricati le loro foto. Ma cosa succede se la partecipazione era automatico e non richiede alcuna abilità o tempo specifico a presentare? Questa è la promessa offerto da "sensing partecipativa" o "people-centric di rilevamento." Per esempio, il Pothole Patrol, un progetto da scienziati del MIT, montato GPS accelerometri attrezzati all'interno di sette taxi nella zona di Boston (Eriksson et al. 2008) . Perché guidando su una buca lascia un segnale accelerometro distinta, questi dispositivi, quando collocato all'interno di taxi in movimento, in grado di creare mappe buca di Boston. Naturalmente, i taxi non campione casuale strade, ma dato abbastanza i taxi, ci possono essere una copertura sufficiente a fornire informazioni su grandi porzioni di essi città. Un secondo vantaggio di sistemi passivi che si basano sulla tecnologia è che de-skill il processo di contribuire dati: mentre si richiede abilità di contribuire alla eBird (perché è necessario essere in grado di identificare in modo affidabile specie di uccelli), che non richiede particolari competenze per contribuire alla Pothole Patrol.

Andando avanti, ho il sospetto che molti progetti di raccolta dati distribuiti inizieranno a fare uso di funzionalità di telefoni cellulari che sono già portati da miliardi di persone in tutto il mondo. Questi telefoni già hanno un gran numero di sensori importanti per la misura, come microfoni, telecamere, dispositivi GPS e orologi. Inoltre, questi telefoni cellulari supportano applicazioni di terze parti che consente ai ricercatori un certo controllo sui protocolli di raccolta dei dati sottostanti. Infine, questi telefoni hanno Internet connettività, rendendo possibile per loro di off-caricare i dati che raccolgono. Ci sono numerose sfide tecniche da sensori inesatto durata della batteria limitata, ma questi problemi saranno probabilmente diminuirà nel corso del tempo come la tecnologia si sviluppa. Le questioni relative alla privacy e l'etica, d'altra parte, potrebbe ottenere più complicate come la tecnologia si sviluppa; Tornerò a questioni di etica quando offro consigli sulla progettazione vostra collaborazione di massa.

Nei progetti di raccolta dati distribuiti, i volontari contribuiscono i dati sul mondo. Questo approccio è già stato utilizzato con successo, e utilizzi futuri dovrà probabilmente affrontare campionamento e di qualità dei dati preoccupazioni. Fortunatamente, i progetti esistenti, come Photocity e Pothole Patrol suggerire soluzioni a questi problemi. Come più progetti sfruttano tecnologia che consente la partecipazione de-qualificati e passiva, distribuito progetti di raccolta dei dati dovrebbe aumentare drammaticamente in scala, consentendo ai ricercatori di raccogliere dati che era semplicemente off limits in passato.