Ďalšie komentáre

Tento preklad bol vytvorený na počítači. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

Ďalšie komentáre

Táto časť je určená na použitie ako referenčný, skôr než aby sa čítať ako príbeh.

Úvod (oddiel 5.1)

Mass spolupráca spája nápady od občana vedy, crowdsourcing, a kolektívne inteligenciu. Citizen science zvyčajne znamená zapojiť "občanov" (tj non-vedci) vo vedeckom procese (Crain, Cooper, and Dickinson 2014) . Crowdsourcing zvyčajne znamená vziať nejaký problém väčšinou vyriešený v rámci organizácie a namiesto toho outsourcing ju do davu (Howe 2009) . Kolektívnej inteligencie zvyčajne znamená skupiny osôb konajúcich spoločne spôsoby, ktoré sa zdajú byť inteligentný (Malone and Bernstein 2015) . Nielsen (2012) je úžasná kniha-dĺžka úvod do moci masové spolupráce pre vedecký výskum.

Existuje mnoho typov hromadnej spolupráce, ktoré sa nezmestia úhľadne do troch kategórií, ktoré som navrhol, a myslím, že tri si zaslúžia osobitnú pozornosť, pretože by mohli byť užitočné v sociálnom výskume v určitom okamihu. Jedným z príkladov je predikčný trhy, kde účastníci kúpiť a obchodné zmluvy, ktoré sú s výpovednou založené na výsledkoch, ktoré sa vyskytujú vo svete (Wolfers and Zitzewitz 2004; Arrow et al. 2008) . Predpovedajúci trhy sú často využívané firmami a vládami pre predpovedanie a predpovedanie trhy boli aj sociálne výskumníkmi použité na predikciu reprodukovateľnosť výsledkov publikovaných štúdií v psychológii (Dreber et al. 2015) .

Druhý príklad, ktorý nie je dobre zapadá do môjho schémy kategorizácie je polymath projekt, kde vedci spolupracovali s použitím blogy a wiki ukázať nové matematických viet (Gowers and Nielsen 2009; Cranshaw and Kittur 2011; Nielsen 2012; Kloumann et al. 2016) . Projekt vševed je v niektorých ohľadoch podobný Netflix cenu, ale medzi účastníkmi projektu vševed aktívnejšie postavený na čiastkové riešenie druhých.

Tretím príkladom, ktorý nie je dobre zapadá do môjho schémy kategorizácie je závislý na čase mobilizáciou, ako je napríklad Defense Advanced Research Projects Agency (DARPA) Network Challenge (tj Red Balloon Challenge). Pre viac informácií o týchto citlivých dobe mobilizácia pozri Pickard et al. (2011) , Tang et al. (2011) , a Rutherford et al. (2013) .

Ľudský výpočet (bod 5.2)

Pojem "ľudský výpočet" vychádza z práce vykonanej počítačových vedcov, a pochopenie súvislostí za tohto výskumu zlepší vašu schopnosť rozoznať problémy, ktoré by mohli byť prístupné na to. Pre určité úlohy, počítače sú neuveriteľne silný so schopnosťami vysoko prevyšuje aj znalecké ľudí. Napríklad v šachu, počítač môže poraziť aj tie najlepšie veľmajstrov. But-a to je menej dobre ocenia spoločenských vedcov, pre iné úlohy, počítače sú v skutočnosti oveľa horšie než ľudia. Inými slovami, práve teraz ste lepší ako aj tie sofistikované počítačom v určité úlohy, ktoré zahŕňajú spracovanie obrázkov, videa, zvuku a textu. Takto ako je vysvetlené nádherné XKCD karikatúre-existujú úlohami, ktoré sú ľahko k počítaču a ťažké pre ľudí, ale sú tu aj úlohy, ktoré sú ťažké pre počítače a jednoduché pre ľudí (obrázok 5.13). Počítačoví odborníci pracujúci na týchto hard-for-počítače-Easy-for-ľudské úlohy, preto si uvedomil, že by mohli zahŕňať ľudí v ich výpočtového procesu. Tu je návod, ako Luis von Ahn (2005) opísal ľudský výpočet, keď prvýkrát razil termín vo svojej dizertačnej práci: ". Paradigma pre využitie ľudského výpočtového výkonu pre riešenie problémov, ktoré počítače môžu ešte vyriešiť"

Obrázok 5.13: Pre niektoré úlohy počítače sú úžasné, presahujúce schopnosť ľudských expertov. Ale pre iné úlohy, obyčajní ľudia môžu prekonať aj sofistikované počítača systémy. Problémy vo veľkom meradle, ktoré sa týkajú úloh, ktoré sú ťažké pre počítače a jednoduché pre ľudí sú vhodné pre ľudskú výpočtu. Používa sa v súlade s podmienkami tu popísaných: http://xkcd.com/license.html

Podľa tejto definície Foldit-, ktoré som opísal v kapitole otvorených výziev, mohlo byť považované za výpočet projekt človek. Avšak, som sa rozhodol zaradiť Foldit ako otvorenú výzvu, pretože vyžaduje špecializované zručnosti a trvá to najlepšie riešenie prispelo skôr než pomocou split-platiť-kombinovať stratégiu.

Za vynikajúce liečbu kniha dĺžku ľudského počítanie, v najvšeobecnejšom slova zmysle, pozri Law and Ahn (2011) . Kapitola 3 Law and Ahn (2011) má zaujímavú diskusiu o zložitejších krokov kombinujú ako tie v tejto kapitole.

Pod pojmom "split-platiť-spojiť" bol používaný Wickham (2011) uvádza stratégia pre štatistické výpočty, ale dokonale zachytáva proces mnohých výpočtových projektov, ľudských. Split-platiť-kombinovať stratégie je podobná rámci MapReduce vypracovaných na Google (Dean and Ghemawat 2004; Dean and Ghemawat 2008) .

Dva chytré výpočtovej projekty v oblasti ľudských že som nemal priestor na diskusiu sú ESP Game (Ahn and Dabbish 2004) a reCAPTCHA (Ahn et al. 2008) . Oba tieto projekty našiel kreatívne spôsoby, ako motivovať účastníkov, aby etikety na snímky. Avšak, obaja z týchto projektov tiež vyvolal etické otázky, pretože na rozdiel od Galaxy Zoo, účastníci ESP Game a reCAPTCHA nevedel, ako sa s ich údajmi nakladá (Lung 2012; Zittrain 2008) .

Inšpirovaný ESP Game, mnohí vedci pokúšali rozvíjať ostatné "hry s cieľom" (Ahn and Dabbish 2008) (teda "človek-based výpočtovej hry" (Pe-Than, Goh, and Lee 2015) ), ktoré môžu byť použitá pre riešenie rad ďalších problémov. Čo tieto "hry s cieľom" majú spoločné to, že sa snaží, aby sa úlohy spojené s ľudskou výpočtu príjemné. Takže zatiaľ čo ESP Game zdieľa rovnaký split-platiť-kombinovať štruktúru s Galaxy Zoo, sa líšia v tom, ako sú účastníci motivované-zábavné vs. túžbou pomáhať vedu.

Môj popis Galaxy Zoo čerpá z Nielsen (2012) , Adams (2012) , Clery (2011) a Hand (2010) , a moja prezentácia výskumných cieľov Galaxy Zoo boli zjednodušené. Pre viac informácií o histórii klasifikácie galaxií v astronómii a ako Galaxy Zoo v tejto tradícii pokračuje, pozri Masters (2012) a Marshall, Lintott, and Fletcher (2015) . V nadväznosti na Galaxy Zoo, vedci dokončili Galaxy Zoo 2, ktorý zhromaždené viac než 60 miliónov zložitejšie morfologické klasifikácie z dobrovoľníkov (Masters et al. 2011) . Ďalej, oni sa rozdelil do problémov von z galaxie morfológie, vrátane skúmanie povrchu Mesiaca, vyhľadávanie planét a prepis staré dokumenty. V súčasnej dobe sú všetky ich projekty sú zhromažďované na www.zooniverse.org (Cox et al. 2015) . Jedným z projektov-Snapshot Serengeti, poskytuje dôkaz, že Galaxy Zoo typu projekty klasifikácie obrazu možno vykonať aj pre výskum v oblasti životného prostredia (Swanson et al. 2016) .

Pre výskumných pracovníkov plánuje použiť mikro-úloha trh práce (napr Amazon Mechanical Turk) pre výpočtového projektu ľudského Chandler, Paolacci, and Mueller (2013) a Wang, Ipeirotis, and Provost (2015) ponúkajú dobrú radu na dizajn úloh a ďalších súvisiacich otázok.

Výskumníci majú záujem o vytvorenie čo som volal druhej generácie ľudský výpočtových systémov (napríklad systémov, ktoré používajú ľudské etikety trénovať študijné modelu počítača) mohli mať záujem Shamir et al. (2014) (pre príklad pomocou audio) a Cheng and Bernstein (2015) . Aj tieto projekty môžu byť vykonané s otvorených výziev, pričom výskumníci súťaží pre vytvorenie modelov strojového učenia s najväčšou prediktívne výkonu. Napríklad tím Galaxy Zoo prevádzkoval otvorenú výzvu a našiel nový prístup, ktorý prekonal jeden vyvinuté v Banerji et al. (2010) ; pozri Dieleman, Willett, and Dambre (2015) pre podrobnosti.

Otvorené hovory (časť 5.3)

Otvorené hovory nie sú ničím novým. V skutočnosti, jeden z najznámejších otvorených výziev siaha až do roku 1714, kedy britský parlament vytvoril zemepisná dĺžka cenu pre každého, kto by mohol vyvinúť spôsob, ako určiť zemepisnú dĺžku lodi na mori. Problém agitoval mnoho z najväčších vedcov dní, vrátane Isaaca Newtona a víťazný roztok bol nakoniec predložený hodinár z vidieka, ktorý priblížil problém odlišne od vedcov, ktorí boli zamerané na riešenie, ktoré by nejakým spôsobom zahŕňať astronómii (Sobel 1996) . Ako tento príklad ukazuje, že jedným z dôvodov otvorenej výzvy sú myšlienka k práci tak dobre, je, že poskytujú prístup k ľuďom s rôznych perspektív a zručností (Boudreau and Lakhani 2013) . Pozri Hong and Page (2004) a Page (2008) pre viac informácií o hodnote rozmanitosti v riešení problému.

Každý z otvorených riadenia volania v kapitole vyžaduje trochu ďalšieho vysvetlenia, prečo patria do tejto kategórie. Po prvé, jeden spôsob, ako by som rozlišovať medzi ľudským počítanie a projekty Otvorená výzva je, či výstup je priemer všetkých roztokov (ľudský) alebo výpočtovej najlepšie riešenie (open call). Netflix cena je trochu chúlostivé v tomto ohľade preto, že najlepším riešením sa ukázalo byť sofistikovaný priemeru individuálnych riešenia, čo priblížil nazýva súbor riešení (Bell, Koren, and Volinsky 2010; Feuerverger, He, and Khatri 2012) . Z pohľadu Netflix, ale všetko, čo museli urobiť, bolo vybrať najlepšie riešenie.

Po druhé tým, že niektoré definície ľudského výpočtu (napr Von Ahn (2005) ), Foldit by mal byť považovaný za výpočet projekt človek. Avšak, som sa rozhodol zaradiť Foldit ako otvorenú výzvu, pretože vyžaduje špecializované zručnosti a trvá to najlepšie riešenie prispelo, nie pomocou split-platiť-kombinovať stratégiu.

A konečne, jeden mohol argumentovať, že Peer-to-patentu je príkladom distribuovaného zberu dát. Som sa rozhodol zahrnúť ako otvorenú výzvu, pretože má súťažný štruktúru podobnú a sú používané len tie najlepšie príspevky (zatiaľ čo s distribuovanou zberu dát, predstava dobrých a zlých príspevkov je menej jasná).

Pre viac informácií o Netflix ceny, pozri Bennett and Lanning (2007) , Thompson (2008) , Bell, Koren, and Volinsky (2010) , a Feuerverger, He, and Khatri (2012) . Pre viac informácií o Foldit vidieť, Cooper et al. (2010) , Andersen et al. (2012) , a Khatib et al. (2011) ; môj popis Foldit čerpá z opisov v Nielsen (2012) , Bohannon (2009) a Hand (2010) . Pre viac informácií o peer-to-patentu, pozri Noveck (2006) , Bestor and Hamp (2010) , Ledford (2007) , a Noveck (2009) .

Podobné výsledky Glaeser et al. (2016) , Mayer-Schönberger and Cukier (2013) , kapitola 10 hlási veľké zisky v produktivite inšpektorov bývanie v New Yorku pri inšpekciách sú vedené prediktívnych modelov. V New Yorku, tieto prediktívne modely boli postavené zamestnanca mesta, ale v iných prípadoch, je možné si predstaviť, že by mohli byť vytvorené alebo zlepšená otvorených výziev (napr Glaeser et al. (2016) ). Avšak, jedna veľká starosť o prediktívne modely sa používa na alokovať zdroje je, že modely majú potenciál na posilnenie existujúcich skreslenia. Mnohí vedci už vedia, "smeti dovnútra, smeti von", a prediktívnych modelov to môže byť "bias v okolnosti, predpojatosť von." Pozri Barocas and Selbst (2016) a O'Neil (2016) pre viac informácií o nebezpečenstvách prediktívnych modelov postavených s neobjektívny tréningových dát.

Jedným z problémov, ktoré by mohli zabrániť vládam pomocou otvorených súťaží je, že vyžaduje uvoľňovanie dát, čo by mohlo viesť k porušeniu ochrany osobných údajov. Pre viac informácií o ochrane osobných údajov a publikovanie dát v otvorených výzvach pozri Narayanan, Huey, and Felten (2016) a diskusia v kapitole 6.

Distribuované zber dát (pozri kapitolu 5.4)

Môj popis eBird čerpá z opisov v Bhattacharjee (2005) a Robbins (2013) . Pre viac informácií o tom, ako výskumníci používajú štatistické modely analýzy dát eBird pozri Hurlbert and Liang (2012) a Fink et al. (2010) . Pre viac informácií o histórii občianskej vedy v ornothology, pozri Greenwood (2007) .

Pre viac informácií o Malawi časopisov Project, pozri Watkins and Swidler (2009) a Kaler, Watkins, and Angotti (2015) . A viac na príbuzné projektu v Južnej Afrike, pozri Angotti and Sennott (2015) . Ďalšie príklady dát výskumu pomocou z Malawi časopisov projektu pozri Kaler (2004) a Angotti et al. (2014) .

Vytvorením vlastného (pozri kapitolu 5.5)

Môj prístup k ponuke dizajnu rady bol induktívnej, na základe príkladov úspešných a neúspešných hromadné projekty spolupráce, ktoré som počul o. K dispozícii je tiež prúd výskumu sa snaží aplikovať všeobecnejší sociálne psychologické teórie navrhovania on-line komunity, ktoré sú relevantné pre navrhovanie masových projektov spolupráce, pozri napríklad, Kraut et al. (2012) .

Pokiaľ ide o motiváciu účastníkov, to je vlastne celkom zložité presne zistiť, prečo ľudia sa podieľať na projektoch hmotnosť spolupráce (Nov, Arazy, and Anderson 2011; Cooper et al. 2010, Raddick et al. (2013) ; Tuite et al. 2011; Preist, Massung, and Coyle 2014) . Ak máte v pláne motivovať účastníkov s platbou na trhu práce micro-úloh (napríklad Amazon Mechanical Turk) Kittur et al. (2013) ponúka nejakú radu.

Pokiaľ ide o umožnenie prekvapenie pre viac príkladov nečakaných objavov pochádzajúcich z projektov Zoouniverse, pozri Marshall, Lintott, and Fletcher (2015) .

Pokiaľ ide o bytie etické, niektoré dobré všeobecné úvody do problematiky sú Gilbert (2015) , Salehi et al. (2015) , Schmidt (2013) , Williamson (2016) , Resnik, Elliott, and Miller (2015) , a Zittrain (2008) . V prípade problémov sa konkrétne týka právnych otázok so zamestnancami dav, pozri Felstiner (2011) . O'Connor (2013) rieši otázky týkajúce sa etického dohľadu výskumu pri role výskumných pracovníkov a účastníkov rozmazaniu. V prípade problémov týkajúcich sa zdieľania dát a zároveň chrániť participats v projektoch občianskych vedy, pozri Bowser et al. (2014) . Oba Purdam (2014) a Windt and Humphreys (2016) mať nejaký diskutuje o etických otázkach v distribuovanom zberu dát. A konečne, väčšina projektov uznať prínos, ale nedávajú autorstvo úver účastníkom. V Foldit, hráči Foldit sú často uvedené ako autor (Cooper et al. 2010; Khatib et al. 2011) . V ďalších projektoch otvorenej výzvy, víťazný prispievateľ môže často napísať článok popisujúci ich riešenia (napr Bell, Koren, and Volinsky (2010) a Dieleman, Willett, and Dambre (2015) ). V rodine Galaxy Zoo projektov, mimoriadne aktívny a významne prispeli sú niekedy vyzývajú, aby sa spoluautormi na papiere. Napríklad Ivan Terentev a Tim Matorny, dvaja účastníci Radio Galaxy Zoo z Ruska, boli spoluautormi na jednom z dokumentov, ktoré vznikli z tohto projektu (Banfield et al. 2016; Galaxy Zoo 2016) .