Komenti më tej

Ky seksion është projektuar për t'u përdorur si një referencë, në vend që të lexohet si një tregim.

  • Hyrje (Neni 5.1)

Bashkëpunimi Mass blends ide nga shkenca qytetare, crowdsourcing, dhe inteligjencës kolektive. Shkenca Qytetar zakonisht do të thotë përfshirjen e "qytetarëve" (dmth, jo-shkencëtarët) në procesin shkencor (Crain, Cooper, and Dickinson 2014) . Bing zakonisht do të thotë marrjen e një problemi zgjidhet zakonisht brenda një organizate dhe në vend të outsourcing atë në një turmë (Howe 2009) . Inteligjencës kolektive zakonisht do të thotë grupe individësh që veprojnë kolektivisht në mënyra që duket inteligjente (Malone and Bernstein 2015) . Nielsen (2012) është një e mrekullueshme hyrje libër të gjatë në fuqinë e bashkëpunimit në masë për kërkime shkencore.

Ka shumë lloje të bashkëpunimit në masë që nuk përshtaten me kujdes në të tre kategoritë që kam propozuar, dhe unë mendoj se tre meritojnë vëmendje të veçantë për shkak se ata mund të jenë të dobishme në hulumtimet sociale në një pikë. Një shembull është tregjet parashikim, ku pjesëmarrësit të blerë dhe kontrata tregtare që janë të kthyeshme në bazë të rezultateve që ndodhin në botë (Wolfers and Zitzewitz 2004; Arrow et al. 2008) . Tregjet e parashikuar janë përdorur shpesh nga kompanitë dhe qeveritë për parashikimin, dhe tregjet që parashikojnë janë përdorur edhe nga studiues sociale të parashikojnë perseritjes e studimeve të botuara në psikologji (Dreber et al. 2015) .

Një shembull i dytë që nuk i përshtatet mirë në skemën time kategorizimit është projekti Dijetar, ku studiuesit kanë bashkëpunuar duke përdorur blogs dhe wikis për të provuar teorema të reja të matematikës (Gowers and Nielsen 2009; Cranshaw and Kittur 2011; Nielsen 2012; Kloumann et al. 2016) . Projekti Dijetar është në disa mënyra të ngjashme me Çmimin Netflix, por pjesëmarrësit e projektit Dijetar i ndërtuar në mënyrë më aktive në zgjidhjet e pjesshme e të tjerëve.

Shembulli i tretë që nuk i përshtatet mirë në skemën time kategorizimit është koha-varur Mobilizime të tilla si Agjencia e Mbrojtjes Advanced Research Projects (DARPA) Rrjeti Challenge (dmth, sfida Red Balloon). Për më shumë në këto kohë të ndjeshme mobilizime të shihni Pickard et al. (2011) , Tang et al. (2011) , dhe Rutherford et al. (2013) .

  • Llogaritje njerëzore (Neni 5.2)

Termi "Llogaritja e njeriut" vjen nga puna e bërë nga shkencëtarët kompjuterike, dhe të kuptuarit e kontekstit pas këtij hulumtimi do të përmirësojë aftësinë tuaj për të marr nga problemet që mund të jenë të përshtatshme për të. Për detyra të caktuara, kompjuterët janë tepër të fuqishme me aftësi që tejkalojnë njerëzit edhe të ekspertëve. Për shembull, në shah, kompjuterat mund të rrahur edhe zotërinjve më të mëdha. Por, dhe kjo është vlerësuar më mirë nga shkencëtarët social-për detyra të tjera, kompjutera në të vërtetë janë shumë më keq se njerëzit. Me fjalë të tjera, tani ju jeni më të mirë se edhe kompjuteri më të sofistikuar në detyra të caktuara që përfshijnë përpunimin e imazheve, video, audio dhe tekst. Kështu, siç është ilustruar nga një mrekullueshme XKCD karikaturë-ka detyra që janë të lehta për kompjuterë dhe të vështirë për njerëzit, por ka edhe detyra që janë të vështirë për kompjuterë dhe të lehtë për njerëzit (Figura 5.13). shkencëtarët kompjuterike që punojnë në këto hard-per-kompjuter-lehtë-për-njerëzore detyrat, pra, e kuptoi se ata mund të përfshijnë njerëzit në procesin e tyre kompjuterike. Ja se si Luis von Ahn (2005) përshkruhet llogaritjen e njeriut kur ai së pari shpikur termin në disertacionin e tij: ". Një paradigmë për shfrytëzimin e të përpunimit të pushtetit të njeriut për të zgjidhur problemet që kompjuterët ende nuk mund të zgjidhë"

Figura 5.13: Për disa detyra kompjutera janë të mahnitshme, duke tejkaluar aftësinë e ekspertëve të njeriut. Por, për detyra të tjera, njerëzit e zakonshëm mund të bëj më mirë të sistemeve të sofistikuara edhe kompjutera. Problemet në shkallë të madhe që përfshijnë detyra që janë të vështirë për kompjuterë dhe të lehtë për njerëzit janë të përshtatshme për llogaritje të njeriut. Përdoren sipas kushteve të përshkruara këtu: http://xkcd.com/license.html

Figura 5.13: Për disa detyra kompjutera janë të mahnitshme, duke tejkaluar aftësinë e ekspertëve të njeriut. Por, për detyra të tjera, njerëzit e zakonshëm mund të bëj më mirë të sistemeve të sofistikuara edhe kompjutera. Problemet në shkallë të madhe që përfshijnë detyra që janë të vështirë për kompjuterë dhe të lehtë për njerëzit janë të përshtatshme për llogaritje të njeriut. Përdoren sipas kushteve të përshkruara këtu: http://xkcd.com/license.html

Me këtë përkufizim FoldIt-që kam përshkruar në seksionin e hapur thirrje-të mund të konsiderohet si një projekt llogaritja e njeriut. Megjithatë, unë zgjedh të kategorizoj FoldIt si një thirrje të hapur për shkak se ajo kërkon aftësi të specializuara dhe kjo merr zgjidhja më e mirë ka kontribuar jo duke përdorur një prishje të aplikojnë-kombinuar strategji.

Për një trajtim të shkëlqyer gjatësi librin e llogaritje të njeriut, në kuptimin më të përgjithshëm të termit, shih Law and Ahn (2011) . Kapitulli 3 i Law and Ahn (2011) ka një diskutim interesant të kombinojnë hapat më komplekse se ato në këtë kapitull.

Termi "prishje të aplikojë-kombinuar" është përdorur nga Wickham (2011) për të përshkruar një strategji për informatikë statistikore, por të përkryer kap procesin e shumë projekteve llogaritje njerëzore. The-aplikojë, të kombinuar ndarë strategji është e ngjashme me kuadrin MapReduce zhvilluar në Google (Dean and Ghemawat 2004; Dean and Ghemawat 2008) .

Dy projekte të zgjuar e llogaritjes njerëzore që nuk kanë hapësirë për të diskutuar janë ESP lojë (Ahn and Dabbish 2004) dhe reCAPTCHA (Ahn et al. 2008) . Të dy këto projekte të gjetur mënyra kreative për të motivuar pjesëmarrësit për të siguruar etiketat në imazhe. Megjithatë, të dyja këto projekte të ngritur pyetje etike, sepse, ndryshe nga Galaxy kopshtin zoologjik, pjesëmarrësit në ESP lojë dhe reCAPTCHA nuk e di se si të dhënat e tyre ishte duke u përdorur (Lung 2012; Zittrain 2008) .

Frymëzuar nga ESP lojë, shumë studiues janë përpjekur të zhvillojnë të tjerët "lojra me një qëllim" (Ahn and Dabbish 2008) (p.sh., "lojra të njeriut me bazë e llogaritjes" (Pe-Than, Goh, and Lee 2015) ) që mund të jetë përdoret për të zgjidhur një sërë problemesh të tjera. Ajo që këto "lojëra me një qëllim" kanë të përbashkët është se ata përpiqen për të bërë detyrat e përfshira në llogaritjen e njeriut të kënaqshme. Kështu, ndërsa ESP lojë ndan të njëjtin prishje të aplikojnë, të kombinuar me strukturën Galaxy kopshtin zoologjik, ajo ndryshon në mënyrën se si janë pjesëmarrës të motivuar-fun vs dëshirën për të ndihmuar shkencën.

Përshkrimi im i Galaxy kopshtin zoologjik bazohet në Nielsen (2012) , Adams (2012) , Clery (2011) , dhe Hand (2010) , dhe prezantimi im nga qëllimet hulumtuese të Galaxy kopshtin zoologjik është thjeshtuar. Për më shumë mbi historinë e klasifikimit galaktikë në astronomi dhe se si Galaxy Zoo vazhdon këtë traditë, shih Masters (2012) dhe Marshall, Lintott, and Fletcher (2015) . Ndërtimi në Galaxy kopshtin zoologjik, hulumtuesit përfunduar Galaxy Zoo 2 të cilat mblidhen më shumë se 60 milionë më shumë klasifikime komplekse morfologjike nga vullnetarët (Masters et al. 2011) . Për më tepër, ata branched jashtë në probleme jashtë morfologjisë galaktikë duke përfshirë eksploruar sipërfaqen e hënës, në kërkim të planeteve, dhe transkriptuar dokumente të vjetra. Aktualisht, të gjitha projektet e tyre janë mbledhur në www.zooniverse.org (Cox et al. 2015) . Një nga projektet-Snapshot Serengeti-ofron prova se Galaxy Zoo-lloj projekte klasifikimit image mund të bëhet për hulumtim të mjedisit (Swanson et al. 2016) .

Për studiuesit duke planifikuar për të përdorur një tregun e punës mikro-detyrë (për shembull, Amazon Turk mekanike) për një projekt llogaritje njerëzore, Chandler, Paolacci, and Mueller (2013) dhe Wang, Ipeirotis, and Provost (2015) ofrojnë këshilla të mira për hartimin e detyrave dhe çështje të tjera të ngjashme.

Hulumtuesit e interesuar në krijimin atë që unë e kam quajtur të gjeneratës së dytë sistemet e llogaritjes njerëzore (p.sh., sistemet që përdorin etiketat e njeriut për të trajnuar një model të mësuarit makinë) mund të jenë të interesuar në Shamir et al. (2014) (për shembull duke përdorur audio) dhe Cheng and Bernstein (2015) . Gjithashtu, këto projekte mund të bëhet me thirrje të hapura, ku studiuesit konkurrojnë për të krijuar modele të mësuarit makinë me punën më të madhe parashikuese. Për shembull, ekipi Galaxy Zoo u zhvillua një thirrje të hapur dhe gjeti një qasje të re që outperformed një zhvilluar në Banerji et al. (2010) ; shih Dieleman, Willett, and Dambre (2015) për detaje.

  • Thirrjet e hapura (Seksioni 5.3)

thirrjet e hapura nuk janë të reja. Në fakt, një nga thirrjet më të njohur të hapura daton në 1714, kur Parlamenti i Britanisë krijuar Çmimin The Longitude për të gjithë ata që do të mund të zhvillojë një mënyrë për të përcaktuar lartësia e një anije në det. Problemi stumped shumë nga shkencëtarët më të mëdhenj të ditëve, duke përfshirë Isak Njutoni, dhe zgjidhja fituese është dorëzuar përfundimisht nga një clockmaker nga fshat i cili iu afrua problemin ndryshe nga shkencëtarët të cilët ishin të fokusuara në një zgjidhje që në njëfarë mënyre do të përfshijë astronomi (Sobel 1996) . Si ky shembull ilustron, një arsye se thirrjet e hapura janë menduar për të punuar aq mirë është se ato ofrojnë qasje për njerëzit me perspektivat dhe aftësi të ndryshme (Boudreau and Lakhani 2013) . Shih Hong and Page (2004) dhe Page (2008) për më shumë në vlerën e diversitetit në zgjidhjen e problemeve.

Secili nga rastet e hapura thirrje në kapitullin kërkon pak shpjegime të mëtejshme për pse ajo i takon në këtë kategori. Së pari, një mënyrë që unë të dalluar mes llogaritje njerëzore dhe projekte thirrje të hapur është nëse prodhimi është një mesatare të të gjitha zgjidhjet (llogaritjes human) ose zgjidhjen më të mirë (thirrje e hapur). Çmimi i Netflix është disi e ndërlikuar në këtë drejtim, sepse zgjidhja më e mirë doli të jetë një mesatare e sofistikuar e zgjidhjeve individuale, një afrua quajtur një zgjidhje ansambël (Bell, Koren, and Volinsky 2010; Feuerverger, He, and Khatri 2012) . Nga perspektiva e Netflix, megjithatë, të gjithë ata duhej të bëja ishte marr zgjidhjen më të mirë.

Së dyti, nga disa përcaktimeve të llogaritjes njerëzore (p.sh., Von Ahn (2005) ), FoldIt duhet të konsiderohet një projekt llogaritja e njeriut. Megjithatë, unë zgjedh të kategorizoj FoldIt si një thirrje të hapur për shkak se ajo kërkon aftësi të specializuara dhe kjo merr zgjidhja më e mirë kontribuar, në vend se duke përdorur një prishje të aplikojnë-kombinuar strategji.

Së fundi, mund të argumentohet se Peer-to-Patentave është një shembull i mbledhjes së të dhënave të shpërndara. Unë zgjedh për të përfshirë atë si një thirrje të hapur për shkak se ajo ka një strukturë konkurs, si dhe vetëm kontributet më të mirë janë përdorur (ndërsa me mbledhjen e të dhënave të shpërndara, ideja e kontributeve të mira dhe të këqija është më pak i qartë).

Për më shumë mbi Çmimin Netflix, shih Bennett and Lanning (2007) , Thompson (2008) , Bell, Koren, and Volinsky (2010) , dhe Feuerverger, He, and Khatri (2012) . Për më shumë mbi FoldIt parë, Cooper et al. (2010) , Andersen et al. (2012) , dhe Khatib et al. (2011) ; përshkrimi im i FoldIt bazohet në përshkrimet në Nielsen (2012) , Bohannon (2009) , dhe Hand (2010) . Për më shumë mbi peer-to-Patentave, shih Noveck (2006) , Bestor and Hamp (2010) , Ledford (2007) , dhe Noveck (2009) .

Ngjashëm me rezultatet e Glaeser et al. (2016) , Mayer-Schönberger and Cukier (2013) , Kapitulli 10 raporte fitimet e mëdha në produktivitetin e inspektorëve të banimit në qytetin e Nju Jorkut, kur inspektimet janë të udhëzuar nga modelet parashikuese. Në New York City, këto modele parashikuese janë ndërtuar nga punonjësit e qytetit, por në raste të tjera, mund të imagjinohet se ata mund të krijohen ose të përmirësohet me thirrje të hapur (p.sh., Glaeser et al. (2016) ). Megjithatë, një shqetësim i madh me modele parashikuese duke u përdorur për shpërndarjen e burimeve është se modelet kanë potencial për të përforcuar paragjykimet ekzistuese. Shumë studiues e dini "mbeturinave në, mbeturina jashtë", dhe me modele parashikuese ajo mund të jetë "paragjykim në, paragjykim jashtë." Shih Barocas and Selbst (2016) dhe O'Neil (2016) për më shumë mbi rreziqet e modeleve parashikuese të ndërtuara me të dhënat e trajnimit të njëanshëm.

Një problem që mund të parandalojë qeveritë nga përdorimi i konkurseve të hapura është se ajo kërkon lirimin e të dhënave, e cila mund të çojë në shkelje të privatësisë. Për më shumë në lidhje me privatësinë dhe lirimin e të dhënave në thirrjet e hapura të shihni Narayanan, Huey, and Felten (2016) dhe diskutimi në kapitullin 6.

  • Mbledhja e të dhënave të shpërndara (Seksioni 5.4)

Përshkrimi im i eBird bazohet në përshkrimet në Bhattacharjee (2005) dhe Robbins (2013) . Për më shumë se si hulumtuesit përdorin modele statistikore për të analizuar të dhënat eBird parë Hurlbert and Liang (2012) dhe Fink et al. (2010) . Për më shumë mbi historinë e shkencës së qytetarëve në ornothology, shih Greenwood (2007) .

Për më shumë mbi Projektin revista Malavi, shih Watkins and Swidler (2009) dhe Kaler, Watkins, and Angotti (2015) . Dhe për më tepër në një projekt lidhur në Afrikën e Jugut, shihni Angotti and Sennott (2015) . Për më shumë shembuj të dhënave kërkimore përdorur nga Projekti i Malawi Journals parë Kaler (2004) dhe Angotti et al. (2014) .

  • Dizajnimin tuaj (Seksioni 5.5)

Qasja ime për të ofruar këshilla të projektimit ishte induktiv, bazuar në shembujt e suksesshëm dhe të dështuar projekte masive bashkëpunimi që unë kam dëgjuar për. Ekziston edhe një rrymë e studimit merr përsipër të zbatojë teori më të përgjithshme shoqërore psikologjike për dizajnimin e komuniteteve online që është relevante për hartimin e projekteve të bashkëpunimit në masë, shih, për shembull, Kraut et al. (2012) .

Sa i përket pjesëmarrësve motivuese, në fakt është mjaft e ndërlikuar për të kuptoj se pikërisht pse njerëzit marrin pjesë në projekte bashkëpunimi në masë (Nov, Arazy, and Anderson 2011; Cooper et al. 2010, Raddick et al. (2013) ; Tuite et al. 2011; Preist, Massung, and Coyle 2014) . Nëse keni ndërmend për të motivuar pjesëmarrësit me pagesë në tregun e punës mikro-detyrë (p.sh., Amazon Mekanike turk) Kittur et al. (2013) ofron disa këshilla.

Lidhur mundësuar surprizë, për më shumë shembuj të zbulimeve të papritura që vijnë nga projekte Zoouniverse, shih Marshall, Lintott, and Fletcher (2015) .

Për sa i përket të qenit etike, disa Paraqitjet e mira të përgjithshme për çështjet e përfshira janë Gilbert (2015) , Salehi et al. (2015) , Schmidt (2013) , Williamson (2016) , Resnik, Elliott, and Miller (2015) , dhe Zittrain (2008) . Për çështje që lidhen në mënyrë specifike me çështjet ligjore me punonjësit e turmës, shih Felstiner (2011) . O'Connor (2013) trajton pyetje në lidhje me mbikëqyrjen etik të hulumtimeve, kur rolet e studiuesve dhe pjesëmarrësve turbullira. Për çështje që lidhen me shkëmbimin e të dhënave, duke mbrojtur participats në projektet shkencorë të qytetarëve, shih Bowser et al. (2014) . Të dy Purdam (2014) dhe Windt and Humphreys (2016) kanë disa diskutime në lidhje me çështjet etike në mbledhjen e të dhënave të shpërndara. Së fundi, shumica e projekteve pranojnë kontribute, por nuk japin kredi autoriale të pjesëmarrësve. Në Foldit, lojtarët Foldit janë renditur shpesh si një autor (Cooper et al. 2010; Khatib et al. 2011) . Në projekte të tjera thirrje të hapur, kontribuesi fituar shpesh mund të shkruani një letër që përshkruan zgjidhjet e tyre (p.sh., Bell, Koren, and Volinsky (2010) dhe Dieleman, Willett, and Dambre (2015) ). Në familjen Galaxy kopshtin zoologjik të projekteve, kontribuues shumë aktive dhe të rëndësishme janë të ftuar disa herë që të jetë bashkë-autorë në gazeta. Për shembull, Ivan Terentev dhe Tim Matorny, dy pjesëmarrës Radio Galaxy Zoo nga Rusia, ishin bashkautorë në një nga letrat që u ngrit nga ky projekt (Banfield et al. 2016; Galaxy Zoo 2016) .