verdere kommentaar

Hierdie afdeling is ontwerp om gebruik te word as 'n verwysing, eerder as om te lees as 'n vertelling.

  • Inleiding (Afdeling 5.1)

Massa samewerking versnitte idees uit burger wetenskap, crowdsourcing, en kollektiewe intelligensie. Burger wetenskap beteken gewoonlik met betrekking tot "burgers" (dit wil sê, nie-wetenskaplikes) in die wetenskaplike proses (Crain, Cooper, and Dickinson 2014) . Crowdsourcing beteken gewoonlik om 'n probleem gewoonlik opgelos binne 'n organisasie en in plaas uitkontraktering dit om 'n skare (Howe 2009) . Kollektiewe intelligensie beteken gewoonlik groepe individue kollektief optree op 'n manier wat lyk intelligente (Malone and Bernstein 2015) . Nielsen (2012) is 'n wonderlike boek-lengte bekendstelling in die krag van massa samewerking vir wetenskaplike navorsing.

Daar is baie verskillende tipes van massa samewerking wat nie netjies pas in die drie kategorieë wat ek voorgestel, en ek dink drie verdien spesiale aandag omdat hulle nuttig in sosiale navorsing op 'n sekere punt kan wees. Een voorbeeld is die voorspelling markte, waar deelnemers te koop en handel kontrakte wat aflosbaar is gebaseer op uitkomste wat in die wêreld (Wolfers and Zitzewitz 2004; Arrow et al. 2008) . Die voorspelling markte word dikwels gebruik deur maatskappye en regerings vir vooruitskatting, en die voorspelling van markte is ook gebruik word deur sosiale navorsers om die herhaalbaarheid van gepubliseerde studies in die sielkunde te voorspel (Dreber et al. 2015) .

'N Tweede voorbeeld wat nie goed pas in my kategorisering skema is die polymath projek, waar navorsers saamgewerk met behulp van blogs en ​​wikis nuwe wiskunde stellings bewys (Gowers and Nielsen 2009; Cranshaw and Kittur 2011; Nielsen 2012; Kloumann et al. 2016) . Die polymath projek is in sommige maniere soortgelyk aan die Netflix-prys, maar in die deelnemers polymath projek meer aktief gebou op die gedeeltelike oplossings van ander.

'N Derde voorbeeld wat nie goed pas in my kategorisering skema is tyd-afhanklike MOBILISATIES soos die verdediging Gevorderde Navorsing Agency Projekte (DARPA) Netwerk Challenge (dit wil sê, die Rooi Ballon Challenge). Vir meer inligting oor hierdie tyd sensitiewe MOBILISATIES sien Pickard et al. (2011) , Tang et al. (2011) , en Rutherford et al. (2013) .

  • Menslike berekening (Afdeling 5.2)

Die term "menslike berekening" kom uit die werk gedoen deur 'n rekenaar wetenskaplikes, en die begrip van die konteks agter hierdie navorsing sal jou vermoë om te kies uit probleme wat ontvanklik is vir dit dalk te verbeter. Vir sekere take, rekenaars is ongelooflik kragtig met vermoëns ver meer as selfs kundige mense. Byvoorbeeld, in skaak, rekenaars kan selfs die beste grootmeesters klop. Maar-en dit is minder goed op prys gestel deur sosiale wetenskaplikes-vir ander take, rekenaars is eintlik veel erger as mense. Met ander woorde, nou jy is beter as selfs die mees gevorderde rekenaar by sekere take met betrekking tot die verwerking van beelde, video, klank, en teks. So-so is geïllustreer deur 'n wonderlike Kletskerk strokiesprent-daar take wat maklik vir rekenaars en moeilik vir mense is, maar daar is ook take wat moeilik vir rekenaars en maklik vir mense (Figuur 5.13). Rekenaar wetenskaplikes werk aan hierdie harde-for-rekenaars-maklik-om-menslike take dus besef dat hulle kan die volgende insluit mense in hul computational proses. Hier is hoe Luis von Ahn (2005) beskryf menslike berekening toe hy die eerste keer die term in sy verhandeling geskep: ". 'N paradigma vir die benutting van menslike verwerking krag om probleme op te los wat rekenaars nog nie kan oplos nie"

Figuur 5.13: Vir sommige take rekenaars is amazing, wat meer as die vermoë van die menslike kundiges. Maar, vir ander take, gewone mense kan selfs gesofistikeerde rekenaars stelsels te klop. Grootskaalse probleme wat take wat moeilik vir rekenaars en maklik vir mense is betrek is goed geskik vir menslike berekening. Gebruik volgens die hier beskryf terme: http://xkcd.com/license.html

Figuur 5.13: Vir sommige take rekenaars is amazing, wat meer as die vermoë van die menslike kundiges. Maar, vir ander take, gewone mense kan selfs gesofistikeerde rekenaars stelsels te klop. Grootskaalse probleme wat take wat moeilik vir rekenaars en maklik vir mense is betrek is goed geskik vir menslike berekening. Gebruik volgens die hier beskryf terme: http://xkcd.com/license.html

Deur hierdie definisie FoldIt-wat ek beskryf in die afdeling oor oop oproepe-oorweeg kan word 'n mens berekening projek. Maar ek kies om FoldIt kategoriseer as 'n oop gesprek, want dit vereis gespesialiseerde vaardighede en dit neem die beste oplossing eerder bygedra as die gebruik van 'n split-pas-kombineer strategie.

Vir 'n uitstekende boek lengte behandeling van menslike berekening, in die mees algemene sin van die woord, sien Law and Ahn (2011) . Hoofstuk 3 van Law and Ahn (2011) het 'n interessante bespreking van meer komplekse kombineer stappe as dié wat in hierdie hoofstuk.

Die term "split-pas-kombineer" is wat gebruik word deur Wickham (2011) om 'n strategie vir statistiese rekenaar beskryf, maar dit perfek vang die proses van baie menslike berekening projekte. Die split-pas-kombineer strategie is soortgelyk aan die MapReduce raamwerk ontwikkel op Google (Dean and Ghemawat 2004; Dean and Ghemawat 2008) .

Twee slim menslike berekening projekte wat ek nie ruimte gehad het om te bespreek is die ESP spel (Ahn and Dabbish 2004) en reCAPTCHA (Ahn et al. 2008) . Beide van hierdie projekte gevind kreatiewe maniere om deelnemers motiveer om etikette te voorsien op die foto. Maar beide van hierdie projekte ook geopper etiese vrae, want, in teenstelling met Galaxy Zoo, deelnemers aan die ESP spel en reCAPTCHA het nie geweet hoe hul data is wat gebruik word (Lung 2012; Zittrain 2008) .

Geïnspireer deur die ESP spel, het baie navorsers probeer om ander "speletjies met 'n doel" te ontwikkel (Ahn and Dabbish 2008) (dit wil sê, "-menslike gebaseer berekening speletjies" (Pe-Than, Goh, and Lee 2015) ) wat gebruik kan word gebruik om 'n verskeidenheid van ander probleme op te los. Wat hierdie "speletjies met 'n doel" in gemeen het, is dat hulle probeer om die take wat betrokke is in die mens se berekening aangenaam te maak. Dus, terwyl die ESP spel deel dieselfde split-pas-kombineer struktuur met Galaxy Zoo, dit verskil in die manier waarop die deelnemers gemotiveerd is pret teen begeerte om die wetenskap te help.

My beskrywing van Galaxy Zoo trek op Nielsen (2012) , Adams (2012) , Clery (2011) , en Hand (2010) , en my aanbieding van die navorsing doelwitte van Galaxy Zoo is vereenvoudig. Vir meer inligting oor die geskiedenis van sterrestelsel klassifikasie in sterrekunde en hoe Galaxy Zoo sit hierdie tradisie voort, sien Masters (2012) en Marshall, Lintott, and Fletcher (2015) . Gebou op Galaxy Zoo, het die navorsers voltooi Galaxy Zoo 2 wat meer as 60 miljoen meer komplekse morfologiese klassifikasies versamel van vrywilligers (Masters et al. 2011) . Verdere, vertakte hulle uitgegaan na probleme buite sterrestelsel morfologie insluitende die verkenning van die oppervlak van die maan, op soek na planete, en transkribering ou dokumente. Op die oomblik is al hul projekte ingesamel by www.zooniverse.org (Cox et al. 2015) . Een van die projekte-Kiekie Serengeti-bewys lewer dat Galaxy Zoo-tipe beeld klassifikasie projekte ook gedoen kan word vir die omgewing navorsing (Swanson et al. 2016) .

Vir navorsers beplan om 'n mikro-taak arbeidsmark (bv, Amazon Meganiese Turk) gebruik vir 'n menslike berekening projek, Chandler, Paolacci, and Mueller (2013) en Wang, Ipeirotis, and Provost (2015) bied 'n goeie raad oor taak ontwerp en ander verwante kwessies.

Navorsers wat belangstel in die skep van wat ek tweede generasie menslike berekening stelsels het genoem (bv stelsels wat menslike etikette gebruik om 'n masjien leermodel te lei) kan wees wat belangstel in Shamir et al. (2014) (vir 'n voorbeeld gebruik van klank) en Cheng and Bernstein (2015) . Ook, kan hierdie projekte gedoen word met 'n oop oproepe, waardeur navorsers meeding om masjienleermodelle skep met die grootste voorspellende prestasie. Byvoorbeeld, die Galaxy Zoo span gehardloop 'n oop gesprek en gevind dat 'n nuwe benadering wat die mens ontwikkel in geklop Banerji et al. (2010) ; sien Dieleman, Willett, and Dambre (2015) vir meer inligting.

  • Oop oproepe (Afdeling 5.3)

Oop oproepe is nie nuut nie. Trouens, een van die mees bekende oop oproepe dateer terug tot 1714 toe Brittanje se parlement geskep Die Longitude prys vir enigiemand wat 'n manier om die lengtegraad van 'n skip te bepaal op see kon ontwikkel. Die probleem stumped baie van die grootste wetenskaplikes van die dae, insluitend Isaac Newton, en die wen-oplossing is uiteindelik ingedien deur 'n horlosiemaker uit die platteland wat die probleem anders wetenskaplikes wat fokus op 'n oplossing te vind wat een of ander manier sterrekunde sou betrek genader (Sobel 1996) . Aangesien hierdie voorbeeld illustreer, een van die redes wat oop oproepe is vermoedelik so goed werk, is dat hulle toegang te gee aan mense met verskillende perspektiewe en vaardighede (Boudreau and Lakhani 2013) . Sien Hong and Page (2004) en Page (2008) vir meer inligting oor die waarde van diversiteit in probleemoplossing.

Elkeen van die oop gesprek gevalle in die hoofstuk is 'n bietjie van 'n verdere verduideliking vir waarom dit hoort in hierdie kategorie. In die eerste plek 'n manier dat ek kan onderskei tussen menslike berekening en oop gesprek projekte is of die uitset is 'n gemiddeld van al die oplossings (menslike berekening) of die beste oplossing (oop gesprek). Die Netflix-prys is 'n bietjie lastig in hierdie verband, want die beste oplossing blyk te wees 'n gesofistikeerde gemiddelde van individuele oplossings wees, 'n genader genoem 'n ensemble oplossing (Bell, Koren, and Volinsky 2010; Feuerverger, He, and Khatri 2012) . Vanuit die perspektief van Netflix egter al wat hulle moes doen was pluk die beste oplossing.

Tweede, deur sommige definisies van menslike berekening (bv Von Ahn (2005) ), FoldIt moet in ag geneem word 'n mens berekening projek. Maar ek kies om FoldIt kategoriseer as 'n oop gesprek, want dit vereis gespesialiseerde vaardighede en dit neem die beste oplossing bygedra, eerder as die gebruik van 'n split-pas-kombineer strategie.

Ten slotte, kan 'n mens argumenteer dat peer-to-Patent is 'n voorbeeld van die verspreide data-insameling. Ek kies om dit in te sluit as 'n oop gesprek, want dit het 'n wedstryd-agtige struktuur en net die beste bydraes word (terwyl met verspreide data-insameling, die idee van 'n goeie en slegte bydraes is minder duidelik).

Vir meer inligting oor die Netflix-prys, sien Bennett and Lanning (2007) , Thompson (2008) , Bell, Koren, and Volinsky (2010) , en Feuerverger, He, and Khatri (2012) . Vir meer inligting oor FoldIt sien, Cooper et al. (2010) , Andersen et al. (2012) , en Khatib et al. (2011) ; my beskrywing van FoldIt trek op beskrywings in Nielsen (2012) , Bohannon (2009) , en Hand (2010) . Vir meer inligting oor peer-to-Patent, sien Noveck (2006) , Bestor and Hamp (2010) , Ledford (2007) , en Noveck (2009) .

Soortgelyk aan die resultate van Glaeser et al. (2016) , Mayer-Schönberger and Cukier (2013) , Hoofstuk 10 verslae groot winste in die produktiwiteit van behuising inspekteurs in New York toe inspeksies word gelei deur voorspellende modelle. In New York City, is hierdie voorspellende modelle gebou deur die stad werknemers, maar in ander gevalle, kan 'n mens dink dat hulle kan geskep word of verbeter met 'n oop oproepe (bv Glaeser et al. (2016) ). Maar een groot bekommernis met voorspellende modelle wat gebruik word om hulpbronne toe te ken, is dat die modelle het die potensiaal om bestaande vooroordele versterk. Baie navorsers weet reeds "garbage in, garbage out", en met voorspellende modelle wat dit kan wees "vooroordeel in, vooroordeel uit." Sien Barocas and Selbst (2016) en O'Neil (2016) vir meer inligting oor die gevare van voorspellende modelle gebou met bevooroordeeld opleiding data.

Een probleem wat kan voorkom regerings van die gebruik van oop wedstryde is dat dit vereis data release, wat kan lei tot privaatheid oortredings. Vir meer inligting oor privaatheid en data vrylating in 'n oop oproepe sien Narayanan, Huey, and Felten (2016) en die bespreking in Hoofstuk 6.

  • Versprei dataversameling (Afdeling 5.4)

My beskrywing van eBird trek op beskrywings in Bhattacharjee (2005) en Robbins (2013) . Vir meer inligting oor hoe navorsers gebruik statistiese modelle om eBird data ontleed sien Hurlbert and Liang (2012) en Fink et al. (2010) . Vir meer inligting oor die geskiedenis van burger wetenskap in ornothology, sien Greenwood (2007) .

Vir meer inligting oor die Malawi Joernale Projek, sien Watkins and Swidler (2009) en Kaler, Watkins, and Angotti (2015) . En vir meer inligting oor 'n verwante projek in Suid-Afrika, sien Angotti and Sennott (2015) . Vir meer voorbeelde van navorsing met behulp van data uit die Malawi Joernale Projek sien Kaler (2004) en Angotti et al. (2014) .

  • Ontwerp van jou eie (Afdeling 5.5)

My benadering tot die aanbied van ontwerp advies was induktiewe, gebaseer op die voorbeelde van suksesvolle en mislukte massa samewerking projekte wat ek gehoor het nie. Daar is ook 'n stroom van navorsing poog meer algemene sosiale sielkundige teorieë toe te pas op die ontwerp van aanlyn-gemeenskappe wat aan die ontwerp van massa samewerking projekte betrokke is, sien, byvoorbeeld, Kraut et al. (2012) .

Met betrekking tot die motivering van deelnemers, dit is eintlik baie moeilik om uit te vind presies die rede waarom mense deelneem aan massa samewerking projekte (Nov, Arazy, and Anderson 2011; Cooper et al. 2010, Raddick et al. (2013) ; Tuite et al. 2011; Preist, Massung, and Coyle 2014) . As jy van plan is om deelnemers te motiveer met betaling op 'n mikro-taak arbeidsmark (bv, Amazon Meganiese Turk) Kittur et al. (2013) bied 'n paar advies.

Met betrekking tot sodat verrassing, vir meer voorbeelde van onverwagse ontdekkings uit te kom van Zoouniverse projekte, sien Marshall, Lintott, and Fletcher (2015) .

Met betrekking tot eties, 'n paar goeie algemene inleiding tot die betrokke kwessies is Gilbert (2015) , Salehi et al. (2015) , Schmidt (2013) , Williamson (2016) , Resnik, Elliott, and Miller (2015) , en Zittrain (2008) . Vir kwessies wat spesifiek verband hou met regskwessies met skare mense, sien Felstiner (2011) . O'Connor (2013) spreek vrae oor etiese toesig van navorsing toe die rolle van navorsers en deelnemers vervaag. Vir kwessies wat verband hou met die deel van data, terwyl die beskerming participats in burger wetenskap projekte, sien Bowser et al. (2014) . Beide Purdam (2014) en Windt and Humphreys (2016) het 'n paar gesprek oor die etiese kwessies in verspreide data-insameling. Ten slotte, die meeste projekte erken bydraes maar outeurskap krediet gee nie om deelnemers. In FoldIt, is die FoldIt spelers dikwels gelys as 'n skrywer (Cooper et al. 2010; Khatib et al. 2011) . Met ander oop oproep projekte, kan die wen bydraer dikwels skryf 'n referaat beskryf hul oplossings (bv, Bell, Koren, and Volinsky (2010) en Dieleman, Willett, and Dambre (2015) ). In die Galaxy Zoo familie van projekte, is baie aktief en belangrike bydraers soms genooi om mede-outeurs van vraestelle wees. Byvoorbeeld, Ivan Terentev en Tim Matorny, twee Radio Galaxy Zoo deelnemers uit Rusland, was mede-outeurs op een van die vraestelle wat ontstaan ​​het uit die projek (Banfield et al. 2016; Galaxy Zoo 2016) .