5.4.3 Záver

Distribuovaný zber dát je možné, a v budúcnosti bude pravdepodobne zahŕňať technológiu a pasívnu účasť.

Ako eBird demonštruje, distribuovaný zber dát môžu byť použité pre vedecký výskum. Ďalej PhotoCity ukazuje, že problémy súvisiace s odberom vzoriek a kvalitu dát sú potenciálne riešiteľné.

Ako by distribuované Data Collection prácu pre sociálny výskum? Skvelý príklad pochádza z práce Susan Watkins a kolegami na Malawi časopisov Projektu (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . V rámci tohto projektu, 22 miestni obyvatelia zvanej "novinári" -kept "konverzačných denníkov", ktoré zaznamenané, v detaile, rozhovory oni začuli o AIDS v každodennom živote obyčajných ľudí (v tom čase začatia projektu, asi 15% dospelých v Malawi boli infikované vírusom HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Vzhľadom na ich status zasvätených, títo novinári boli schopní počuť rozhovory, ktoré mohli byť neprístupné pre Susan Watkins a jej západnými výskumnými spolupracovníkmi (budem diskutovať o etike neskôr v tejto kapitole, keď som poskytovať poradenstvo o navrhovaní svoje vlastné hmotnosť spolupracovať na projektoch, ). Dáta z Malawi časopisov projekt viedol k sérii významných nálezov. Napríklad pred začatím projektu, mnohí outsideri veril, že to tam bolo ticho o AIDS v subsaharskej Afrike, ale časopisy preukázali, že to zjavne nie je prípad: novinári vypočul stovky rozhovore na túto tému, v miestach, ako rôznorodý ako pohreby , bary a kostoly. Ďalej, povaha týchto rozhovorov pomohol vedci lepšie pochopiť niektoré z odolnosti proti používaniu kondómov; tak, že kondóm použitie bol zostavený v správach verejného zdravia bolo v rozpore s tým, ako že to bolo diskutované v každodennom živote (Tavory and Swidler 2009) .

Samozrejme, rovnako ako dáta z eBird, dáta z Malawi Journals projektu nie je dokonalý, problém diskutovalo podrobne Watkins a spol. Napríklad nahrané rozhovory nie sú náhodný vzorka zo všetkých možných konverzácií. Skôr sa jedná neúplný súpis rozhovory o AIDS. Z hľadiska kvality dát, výskumníci veria, že ich novinári boli vysoko kvalitné reportérov, o čom svedčí konzistencie v časopisoch a naprieč časopisoch. Ďalej, keď sú dosť novinári rozmiestnené v dostatočne malom prostredí a správy sú zamerané na konkrétnu tému, redundancia bolo možné, čo zvyšuje dôveru v kvalitu údajov. Napríklad, sexuálna pracovníčka s názvom "Stella" sa objavil niekoľkokrát v časopisoch štyroch rôznych novinárov (Watkins and Swidler 2009) . Ako to bolo v PhotoCity, využitie redundancie je dôležitou zásadou pre hodnotenie a zabezpečenie kvality dát v distribuovaných projektov zberu dát. Aby bolo možné ďalej stavať svoju intuíciu, Tabuľka 5.3 ukazuje ďalšie príklady distribuovaného zberu dát pre sociálny výskum.

Tabuľka 5.3: Príklady distribuovaných projektov zberu dát v oblasti sociálneho výskumu.
zhromaždené údaje citácie
Diskusia o HIV / AIDS v Malawi Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015)
Pouličné žobranie v Londýne Purdam (2014)
Konfliktné udalosti vo východnom Kongu Windt and Humphreys (2016)
Ekonomická aktivita v Nigérii av Libérii Blumenstock, Keleher, and Reisinger (2016)
chrípka dohľad Noort et al. (2015)

Všetky príklady opísané v tejto časti sa týkali aktívnu účasť: novinári prepísal rozhovory, ktoré počul; birders nahral svoje birding zoznamy; alebo prehrávača nahrali svoje fotografie. Ale čo v prípade, že účasť bola automatická a nevyžaduje žiadne špeciálne zručnosti alebo čas na predloženie žiadosti? To je sľub ponúkaných "participatívna snímanie" alebo "people-centric prieskumu." Napríklad, výmoľ Patrol, projekt vedci na MIT, sa zvyšoval GPS vybavené zrýchlenie vnútri siedmich taxíky v oblasti Bostone (Eriksson et al. 2008) . Vzhľadom k tomu, jazde cez výmoľ zanecháva zreteľný signál, akcelerometer tieto zariadenia pri umiestnení vo vnútri pohyblivých taxislužby, môžu vytvárať výmoľ mapy Bostonu. Samozrejme, že taxíky nie sú náhodne ochutnať cesty, ale vzhľadom k tomu dosť taxi, môže byť dostačujúce krytia poskytovať informácie o veľkých častiach oni mesta. Druhou výhodou pasívne systémy, ktoré sú založené na technológii je, že de-zručnosť proces prispieva údaje: kým vyžaduje zručnosť, aby prispeli k eBird (pretože je nutné, aby bolo možné spoľahlivo identifikovať druhy vtákov), nevyžaduje žiadne špeciálne zručnosti na prispieť k Pothole Patrol.

Do budúcnosti mám podozrenie, že projekty zberu mnoho distribuovaných dát začne využívať schopnosti mobilných telefónov, ktoré sú už vykonaných miliardy ľudí na celom svete. Tieto telefóny už majú veľký počet čidiel ktoré sú dôležité pre meranie, ako sú mikrofóny, kamery, zariadenie GPS a hodiny. Ďalej, tieto mobilné telefóny podporujú aplikácie tretích strán umožňujúce vedcom nejakú kontrolu nad podkladovým protokolov zberu dát. A nakoniec, tieto telefóny majú internet-pripojenie, takže je možné, aby off-načítať údaje, ktoré zhromaždili. Existujú početné technické problémy z nepresných senzorov k obmedzenej životnosti batérie, ale tieto problémy bude pravdepodobne časom zníži vývojom technológií. Problémy spojené s súkromia a etiky, na druhej strane, mohol dostať zložitejšie, pretože technológia sa vyvíja; Vrátim sa k otázkam etiky, keď som sa poradia o vytvorením vlastného masovú spoluprácu.

V distribuovaných projektov zberu dát, dobrovoľníci prispievajú údaje o sveta. Tento prístup bol už úspešne použitý, a budúce využitie bude pravdepodobne musieť riešiť odberu vzoriek a kvality dát problémy. Našťastie súčasné projekty, ako je PhotoCity a Pothole Patrol navrhnúť riešenie týchto problémov. Ako ďalšie projekty využívajú technológiu, ktorá umožňuje de-kvalifikovaných a pasívnu účasť, distribuované projekty zhromažďovania údajov by mali výrazne zvýšiť v mierke, čo umožňuje vedcom zbierať dáta, ktoré boli jednoducho tabu v minulosti.