Další komentáře

Tento překlad byl vytvořen na počítači. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

Další komentáře

Tato část je určena k použití jako referenční, spíše než aby se číst jako příběh.

Úvod (oddíl 5.1)

Mass spolupráce spojuje nápady od občana vědy, crowdsourcing, a kolektivní inteligenci. Citizen science obvykle znamená zapojit "občany" (tj non-vědci) ve vědeckém procesu (Crain, Cooper, and Dickinson 2014) . Crowdsourcing obvykle znamená vzít nějaký problém většinou vyřešen v rámci organizace a místo toho outsourcing ji do davu (Howe 2009) . Kolektivní inteligence obvykle znamená skupiny osob jednajících společně způsoby, které se zdají být inteligentní (Malone and Bernstein 2015) . Nielsen (2012) je úžasná kniha-délka úvod do moci masové spolupráce pro vědecký výzkum.

Existuje mnoho typů hromadné spolupráce, které se nevejdou úhledně do tří kategorií, které jsem navrhl, a myslím, že tři si zaslouží zvláštní pozornost, protože by mohly být užitečné v sociálním výzkumu v určitém okamžiku. Jedním z příkladů je predikční trhy, kde účastníci koupit a obchodní smlouvy, které jsou s výpovědní založeny na výsledcích, které se vyskytují ve světě (Wolfers and Zitzewitz 2004; Arrow et al. 2008) . Předpovídající trhy jsou často využívány firmami a vládami pro předpovídání a předpovídání trhy byly také sociální výzkumníky použity k predikci reprodukovatelnost výsledků publikovaných studií v psychologii (Dreber et al. 2015) .

Druhý příklad, který není dobře zapadá do mého schématu kategorizace je polymath projekt, kde vědci spolupracovali s použitím blogy a wiki ukázat nové matematické teorémy (Gowers and Nielsen 2009; Cranshaw and Kittur 2011; Nielsen 2012; Kloumann et al. 2016) . Projekt vševěd je v některých ohledech podobný Netflix cenu, ale mezi účastníky projektu vševěd aktivněji postaven na dílčí řešení druhých.

Třetím příkladem, který není dobře zapadá do mého schématu kategorizace je závislý na čase mobilizací, jako je například Defense Advanced Research Projects Agency (DARPA) Network Challenge (tj Red Balloon Challenge). Pro více informací o těchto citlivých době mobilizace viz Pickard et al. (2011) , Tang et al. (2011) , a Rutherford et al. (2013) .

Lidský výpočet (bod 5.2)

Pojem "lidský výpočet" vychází z práce vykonané počítačových vědců, a pochopení souvislostí za tohoto výzkumu zlepší vaši schopnost rozeznat problémy, které by mohly být přístupné na to. Pro určité úkoly, počítače jsou neuvěřitelně silný se schopnostmi vysoce převyšuje i znalecké lidi. Například v šachu, počítač může porazit i ty nejlepší velmistrů. But-a to je méně dobře ocení společenských vědců, pro jiné úkoly, počítače jsou ve skutečnosti mnohem horší než lidé. Jinými slovy, právě teď jste lepší než i ty sofistikované počítačem v určité úkoly, které zahrnují zpracování obrázků, videa, zvuku a textu. Takto jak bylo objasněno nádherné XKCD karikatuře-existují úkoly, které jsou snadno k počítači a těžké pro lidi, ale jsou zde i úkoly, které jsou těžké pro počítače a snadné pro lidi (obrázek 5.13). Počítačoví odborníci pracující na těchto hard-for-počítače-Easy-for-lidské úlohy, proto si uvědomil, že by mohly zahrnovat lidi v jejich výpočetního procesu. Zde je návod, jak Luis von Ahn (2005) popsal lidský výpočet, když poprvé razil termín ve své disertační práci: ". Paradigma pro využití lidského výpočetního výkonu pro řešení problémů, které počítače mohou ještě vyřešit"

Obrázek 5.13: Pro některé úkoly počítače jsou úžasné, přesahující schopnost lidských expertů. Ale pro jiné úkoly, obyčejní lidé mohou překonat i sofistikované počítače systémy. Problémy ve velkém měřítku, které se týkají úkolů, které jsou těžké pro počítače a snadné pro lidi jsou vhodné pro lidskou výpočtu. Používá se v souladu s podmínkami zde popsaných: http://xkcd.com/license.html

Podle této definice Foldit-, které jsem popsal v kapitole otevřených výzev, mohlo být považováno za výpočet projekt člověk. Nicméně, jsem se rozhodl zařadit Foldit jako otevřenou výzvu, protože vyžaduje specializované dovednosti a trvá to nejlepší řešení přispělo spíše než pomocí split-platit-kombinovat strategii.

Za vynikající léčbu kniha délce lidského počítání, v nejobecnějším slova smyslu, viz Law and Ahn (2011) . Kapitola 3 Law and Ahn (2011) má zajímavou diskusi o složitějších kroků kombinují než ty v této kapitole.

Pod pojmem "split-platit-spojit" byl používán Wickham (2011) popisuje strategii pro statistické výpočty, ale dokonale zachycuje proces mnoha výpočetních projektů, lidských. Split-platit-kombinovat strategie je podobná rámci MapReduce vypracovaných na Google (Dean and Ghemawat 2004; Dean and Ghemawat 2008) .

Dva chytré výpočetní projekty v oblasti lidských že jsem neměl prostor k diskusi jsou ESP Game (Ahn and Dabbish 2004) a reCAPTCHA (Ahn et al. 2008) . Oba tyto projekty našel kreativní způsoby, jak motivovat účastníky, aby etikety na snímky. Nicméně, oba z těchto projektů také vyvolal etické otázky, protože na rozdíl od Galaxy Zoo, účastníci ESP Game a reCAPTCHA nevěděl, jak se s jejich údaji nakládá (Lung 2012; Zittrain 2008) .

Inspirován ESP Game, mnozí vědci pokoušeli rozvíjet ostatní "hry s cílem" (Ahn and Dabbish 2008) (tedy "člověk-based výpočetní hry" (Pe-Than, Goh, and Lee 2015) ), které mohou být použita pro řešení řadu dalších problémů. Co tyto "hry s cílem" mají společné to, že se snaží, aby úkoly spojené s lidskou výpočtu příjemné. Takže zatímco ESP Game sdílí stejný split-platit-kombinovat strukturu s Galaxy Zoo, se liší v tom, jak jsou účastníci motivované-zábavné vs. touhou pomáhat vědu.

Můj popis Galaxy Zoo čerpá z Nielsen (2012) , Adams (2012) , Clery (2011) a Hand (2010) , a moje prezentace výzkumných cílů Galaxy Zoo byla zjednodušena. Pro více informací o historii klasifikace galaxií v astronomii a jak Galaxy Zoo v této tradici pokračuje, viz Masters (2012) a Marshall, Lintott, and Fletcher (2015) . V návaznosti na Galaxy Zoo, vědci dokončili Galaxy Zoo 2, který shromážděné více než 60 milionů složitější morfologické klasifikace z dobrovolníků (Masters et al. 2011) . Dále, oni se rozdělil do problémů ven z galaxie morfologie, včetně zkoumání povrchu Měsíce, vyhledávání planet a přepis staré dokumenty. V současné době jsou všechny jejich projekty jsou shromažďovány na www.zooniverse.org (Cox et al. 2015) . Jedním z projektů-Snapshot Serengeti, poskytuje důkaz, že Galaxy Zoo typu projekty klasifikace obrazu lze provést i pro výzkum v oblasti životního prostředí (Swanson et al. 2016) .

Pro výzkumné pracovníky plánuje použít mikro-úkol trh práce (např Amazon Mechanical Turk) pro výpočetního projektu lidského Chandler, Paolacci, and Mueller (2013) a Wang, Ipeirotis, and Provost (2015) nabízejí dobrou radu na design úloh a dalších souvisejících otázek.

Výzkumníci mají zájem o vytvoření co jsem volal druhé generace lidský výpočetních systémů (například systémy, které používají lidské etikety trénovat studijní modelu počítače) mohli mít zájem Shamir et al. (2014) (pro příklad pomocí audio) a Cheng and Bernstein (2015) . Také tyto projekty mohou být provedeno s otevřených výzev, přičemž výzkumníci soutěží pro vytvoření modelů strojového učení s největší prediktivní výkonu. Například tým Galaxy Zoo provozoval otevřenou výzvu a našel nový přístup, který překonal jeden vyvinuté v Banerji et al. (2010) ; viz Dieleman, Willett, and Dambre (2015) pro podrobnosti.

Otevřené hovory (bod 5.3)

Otevřené hovory nejsou ničím novým. Ve skutečnosti, jeden z nejznámějších otevřených výzev sahá až do roku 1714, kdy britský parlament vytvořil zeměpisná délka cenu pro každého, kdo by mohl vyvinout způsob, jak určit zeměpisnou délku lodi na moři. Problém agitoval mnoho z největších vědců dnů, včetně Isaaca Newtona a vítězný roztok byl nakonec předložen hodinář z venkova, který přiblížil problém odlišně od vědců, kteří byly zaměřeny na řešení, které by nějakým způsobem zahrnovat astronomii (Sobel 1996) . Jako tento příklad ukazuje, že jedním z důvodů otevřené výzvy jsou myšlenka k práci tak dobře, je, že poskytují přístup k lidem s různých perspektiv a dovedností (Boudreau and Lakhani 2013) . Viz Hong and Page (2004) a Page (2008) pro více informací o hodnotě rozmanitosti v řešení problému.

Každý z otevřených řízení volání v kapitole vyžaduje trochu dalšího vysvětlení, proč patří do této kategorie. Za prvé, jeden způsob, jak bych rozlišovat mezi lidským počítání a projekty Otevřená výzva je, zda výstup je průměr všech roztoků (lidský) nebo výpočetní nejlepší řešení (open call). Netflix cena je poněkud choulostivé v tomto ohledu proto, že nejlepším řešením se ukázalo být sofistikovaný průměru individuálních řešení, což přiblížil nazývá soubor řešení (Bell, Koren, and Volinsky 2010; Feuerverger, He, and Khatri 2012) . Z pohledu Netflix, ale všechno, co museli udělat, bylo vybrat nejlepší řešení.

Za druhé tím, že některé definice lidského výpočtu (např Von Ahn (2005) ), Foldit by měl být považován za výpočet projekt člověk. Nicméně, jsem se rozhodl zařadit Foldit jako otevřenou výzvu, protože vyžaduje specializované dovednosti a trvá to nejlepší řešení přispělo, nikoli pomocí split-platit-kombinovat strategii.

A konečně, jeden mohl argumentovat, že Peer-to-patentu je příkladem distribuovaného sběru dat. Jsem se rozhodl zahrnout jako otevřenou výzvu, protože má soutěžní strukturu podobnou a jsou používány jen ty nejlepší příspěvky (zatímco s distribuovanou sběru dat, představa dobrých a špatných příspěvků je méně jasná).

Pro více informací o Netflix ceny, viz Bennett and Lanning (2007) , Thompson (2008) , Bell, Koren, and Volinsky (2010) , a Feuerverger, He, and Khatri (2012) . Pro více informací o Foldit vidět, Cooper et al. (2010) , Andersen et al. (2012) , a Khatib et al. (2011) ; můj popis Foldit čerpá z popisů v Nielsen (2012) , Bohannon (2009) a Hand (2010) . Pro více informací o peer-to-patentu, viz Noveck (2006) , Bestor and Hamp (2010) , Ledford (2007) , a Noveck (2009) .

Podobné výsledky Glaeser et al. (2016) , Mayer-Schönberger and Cukier (2013) , kapitola 10 hlásí velké zisky v produktivitě inspektorů bydlení v New Yorku při inspekcích jsou vedeny prediktivních modelů. V New Yorku, tyto prediktivní modely byly postaveny zaměstnance města, ale v jiných případech, je možné si představit, že by mohly být vytvořeny nebo zlepšena otevřených výzev (např Glaeser et al. (2016) ). Nicméně, jedna velká starost o prediktivní modely se používá k alokovat zdroje je, že modely mají potenciál k posílení stávajících zkreslení. Mnozí vědci už vědí, "smetí dovnitř, smetí ven", a prediktivních modelů to může být "bias v okolnosti, předpojatost ven." Viz Barocas and Selbst (2016) a O'Neil (2016) pro více informací o nebezpečích prediktivních modelů postavených s neobjektivní tréninkových dat.

Jedním z problémů, které by mohly zabránit vládám pomocí otevřených soutěží je, že vyžaduje uvolňování dat, což by mohlo vést k porušení ochrany osobních údajů. Pro více informací o ochraně osobních údajů a publikování dat v otevřených výzvách viz Narayanan, Huey, and Felten (2016) a diskuse v kapitole 6.

Distribuované sběr dat (viz kapitola 5.4)

Můj popis eBird čerpá z popisů v Bhattacharjee (2005) a Robbins (2013) . Pro více informací o tom, jak výzkumníci používají statistické modely pro analýzu dat eBird viz Hurlbert and Liang (2012) a Fink et al. (2010) . Pro více informací o historii občanské vědy v ornothology, viz Greenwood (2007) .

Pro více informací o Malawi časopisů Project, viz Watkins and Swidler (2009) a Kaler, Watkins, and Angotti (2015) . A více na příbuzné projektu v Jižní Africe, viz Angotti and Sennott (2015) . Další příklady dat výzkumu pomocí z Malawi časopisů projektu viz Kaler (2004) a Angotti et al. (2014) .

Vytvořením vlastního (viz kapitola 5.5)

Můj přístup k nabídce designu rady byl induktivní, na základě příkladů úspěšných a neúspěšných hromadné projekty spolupráce, které jsem slyšel o. K dispozici je také proud výzkumu se snaží aplikovat obecnější sociální psychologické teorie navrhování on-line komunity, které jsou relevantní pro navrhování masových projektů spolupráce, viz například, Kraut et al. (2012) .

Pokud jde o motivaci účastníků, to je vlastně docela složité přesně zjistit, proč lidé se podílet na projektech hmotnost spolupráce (Nov, Arazy, and Anderson 2011; Cooper et al. 2010, Raddick et al. (2013) ; Tuite et al. 2011; Preist, Massung, and Coyle 2014) . Pokud máte v plánu motivovat účastníky s platbou na trhu práce micro-úloh (například Amazon Mechanical Turk) Kittur et al. (2013) nabízí nějakou radu.

Pokud jde o umožnění překvapení pro více příkladů nečekaných objevů pocházejících z projektů Zoouniverse, viz Marshall, Lintott, and Fletcher (2015) .

Pokud jde o bytí etické, některé dobré všeobecné úvody do problematiky jsou Gilbert (2015) , Salehi et al. (2015) , Schmidt (2013) , Williamson (2016) , Resnik, Elliott, and Miller (2015) , a Zittrain (2008) . V případě problémů se konkrétně týká právních otázek se zaměstnanci dav, viz Felstiner (2011) . O'Connor (2013) řeší otázky týkající se etického dohledu výzkumu při role výzkumných pracovníků a účastníků rozmazání. V případě problémů týkajících se sdílení dat a zároveň chránit participats v projektech občanských vědy, viz Bowser et al. (2014) . Oba Purdam (2014) a Windt and Humphreys (2016) mít nějaký diskutuje o etických otázkách v distribuovaném sběru dat. A konečně, většina projektů uznat přínos, ale nedávají autorství úvěr účastníkům. V Foldit, hráči Foldit jsou často uvedeny jako autor (Cooper et al. 2010; Khatib et al. 2011) . V dalších projektech otevřené výzvy, vítězný přispěvatel může často napsat článek popisující jejich řešení (např Bell, Koren, and Volinsky (2010) a Dieleman, Willett, and Dambre (2015) ). V rodině Galaxy Zoo projektů, mimořádně aktivní a významně přispěly jsou někdy vyzývají, aby se spoluautory na papíry. Například Ivan Terentev a Tim Matorny, dva účastníci Radio Galaxy Zoo z Ruska, byli spoluautory na jednom z dokumentů, které vznikly z tohoto projektu (Banfield et al. 2016; Galaxy Zoo 2016) .