sylwebaeth pellach

Mae'r adran hon wedi'i chynllunio i gael ei ddefnyddio fel cyfeiriad, yn hytrach nag i'w ddarllen fel naratif.

  • Cyflwyniad (Adran 5.1)

Cydweithio Offeren cyfuniadau syniadau o wyddoniaeth y dinesydd, crowdsourcing, a chudd-wybodaeth ar y cyd. Gwyddoniaeth Dinesydd fel arfer yn golygu cynnwys "dinasyddion" (hy, di-wyddonwyr) yn y broses wyddonol (Crain, Cooper, and Dickinson 2014) . Crowdsourcing fel arfer yn golygu cymryd problem datrys fel arfer o fewn sefydliad, ac yn lle hynny allanoli i dorf (Howe 2009) . Cudd-wybodaeth ar y cyd fel arfer yn golygu grwpiau o unigolion sy'n gweithredu ar y cyd mewn ffyrdd sy'n ymddangos yn ddeallus (Malone and Bernstein 2015) . Nielsen (2012) yn gyflwyniad llyfr-hyd hyfryd i mewn i'r pŵer cydlafurio torfol ar gyfer ymchwil wyddonol.

Mae sawl math o gydweithio màs nad ydynt yn ffitio'n daclus i y tri chategori a gynigiais, ac yr wyf yn meddwl tri yn haeddu sylw arbennig oherwydd efallai y byddent yn ddefnyddiol mewn ymchwil gymdeithasol ar ryw adeg. Un enghraifft yw marchnadoedd rhagfynegi, lle mae cyfranogwyr yn prynu a chontractau masnachol sy'n adenilladwy yn seiliedig ar ganlyniadau sy'n digwydd yn y byd (Wolfers and Zitzewitz 2004; Arrow et al. 2008) . Marchnadoedd Rhagweld cael eu defnyddio'n aml gan gwmnïau a llywodraethau ar gyfer rhagweld, a marchnadoedd rhagweld hefyd wedi cael eu defnyddio gan ymchwilwyr cymdeithasol i ragweld y atgynhyrchu o astudiaethau a gyhoeddwyd mewn seicoleg (Dreber et al. 2015) .

Mae ail enghraifft nad yw'n ffitio yn dda i mewn i fy cynllun categoreiddio yw'r prosiect polymath, lle mae ymchwilwyr cydweithiodd ddefnyddio blogiau a wikis i brofi theoremau mathemateg newydd (Gowers and Nielsen 2009; Cranshaw and Kittur 2011; Nielsen 2012; Kloumann et al. 2016) . Mae'r prosiect polymath mewn rhai ffyrdd tebyg i'r Wobr Netflix, ond yn y prosiect polymath cyfranogwyr a adeiladwyd yn fwy gweithredol ar yr atebion rhannol o bobl eraill.

Mae trydydd Enghraifft nad yw'n ffitio yn dda i mewn i fy cynllun categoreiddio yn mobilizations amser-ddibynnol megis yr Asiantaeth Defense Ymchwil Uwch Prosiectau (DARPA) Her Rhwydwaith (hy, y Sialens Balwn Coch). Am fwy ar y rhain amser mobilizations sensitif gweler Pickard et al. (2011) , Tang et al. (2011) , a Rutherford et al. (2013) .

  • Gyfrifiannu Dynol (Adran 5.2)

Mae'r term "cyfrifiant dynol" yn dod allan o waith a wnaed gan wyddonwyr cyfrifiadurol, a deall y cyd-destun y tu ôl i ymchwil hwn yn gwella eich gallu i ddewis broblemau a allai fod yn barod i iddo. Ar gyfer tasgau penodol, cyfrifiaduron yn hynod o bwerus gyda galluoedd llawer uwch na bodau dynol hyd yn oed yn arbenigwr. Er enghraifft, mewn gwyddbwyll, gall cyfrifiaduron guro hyd yn oed y meistri mawreddog gorau. Ond-ac mae hyn yn cael ei werthfawrogi cystal gan wyddonwyr cymdeithasol-ar gyfer tasgau eraill, cyfrifiaduron mewn gwirionedd llawer gwaeth na phobl. Mewn geiriau eraill, ar hyn o bryd rydych yn well nag hyd yn oed y cyfrifiadur mwyaf soffistigedig yn y tasgau penodol yn ymwneud â phrosesu delweddau, fideo, sain, a thestun. Felly-fel y dangosir gan XKCD gwych cartŵn-mae tasgau sy'n hawdd i gyfrifiaduron ac yn galed ar gyfer pobl, ond mae yna hefyd tasgau sy'n anodd ar gyfer cyfrifiaduron ac yn hawdd i bobl (Ffigur 5.13). gwyddonwyr cyfrifiadur sy'n gweithio ar y rhain galed-i-cyfrifiaduron-hawdd-i-dynol tasgau, felly, sylweddoli y gallent gynnwys bodau dynol yn eu proses cyfrifiadol. Dyma sut Luis von Ahn (2005) a ddisgrifir cyfrifiant dynol pan fathodd y term yn ei draethawd hir gyntaf: ". Patrwm ar gyfer defnyddio pŵer prosesu dynol i ddatrys problemau na all cyfrifiaduron datrys eto"

Ffigur 5.13: Ar gyfer rhai tasgau cyfrifiaduron yn anhygoel, yn fwy na gallu'r arbenigwyr dynol. Ond, ar gyfer tasgau eraill, gall bodau dynol cyffredin yn perfformio'n well na systemau cyfrifiaduron hyd yn oed yn soffistigedig. problemau ar raddfa fawr sy'n cynnwys tasgau sy'n anodd ar gyfer cyfrifiaduron ac yn hawdd i bobl yn gweddu'n dda ar gyfer cyfrifiannu dynol. Ddefnyddir yn ôl y telerau a ddisgrifir yma: http://xkcd.com/license.html

Ffigur 5.13: Ar gyfer rhai tasgau cyfrifiaduron yn anhygoel, yn fwy na gallu'r arbenigwyr dynol. Ond, ar gyfer tasgau eraill, gall bodau dynol cyffredin yn perfformio'n well na systemau cyfrifiaduron hyd yn oed yn soffistigedig. problemau ar raddfa fawr sy'n cynnwys tasgau sy'n anodd ar gyfer cyfrifiaduron ac yn hawdd i bobl yn gweddu'n dda ar gyfer cyfrifiannu dynol. Ddefnyddir yn ôl y telerau a ddisgrifir yma: http://xkcd.com/license.html

Drwy ddiffiniad hwn FoldIt-a ddisgrifiais yn yr adran ar agor o alwadau-gellid ystyried prosiect cyfrifiant dynol. Fodd bynnag, yr wyf yn dewis i gategoreiddio FoldIt fel galwad agored am ei fod yn gofyn am sgiliau arbenigol ac mae'n cymryd cyfrannodd yr ateb gorau yn hytrach na defnyddio hollt-ymgeisio-cyfuno strategaeth.

Ar gyfer triniaeth hyd llyfr ardderchog o cyfrifiant dynol, yn yr ystyr mwyaf cyffredinol y term, gweler Law and Ahn (2011) . Pennod 3 o Law and Ahn (2011) mae gan drafodaeth ddiddorol o cyfuno camau mwy cymhleth na'r rhai yn y bennod hon.

Mae'r term "hollt-ymgeisio-cyfuno" yn cael ei ddefnyddio gan Wickham (2011) i ddisgrifio strategaeth ar gyfer cyfrifiadura ystadegol, ond mae'n berffaith cyfleu broses o nifer o brosiectau gyfrifiannu dynol. Y-ymgeisio-cyfuno rhaniad strategaeth yn debyg i'r fframwaith MapReduce a ddatblygwyd yn Google (Dean and Ghemawat 2004; Dean and Ghemawat 2008) .

Mae dau brosiect gyfrifiannu dynol clyfar nad oedd gen i le i drafod yn y Gêm CSA (Ahn and Dabbish 2004) a reCAPTCHA (Ahn et al. 2008) . Mae'r ddau o'r prosiectau hyn hyd i ffyrdd creadigol i ysgogi cyfranogwyr i roi labeli ar ddelweddau. Fodd bynnag, y ddau o'r prosiectau hyn hefyd yn codi cwestiynau moesegol oherwydd, yn wahanol Galaxy Sw, nid cymryd rhan yn y gêm CSA a reCAPTCHA ddim yn gwybod sut mae eu data yn cael ei ddefnyddio (Lung 2012; Zittrain 2008) .

Wedi'i ysbrydoli gan y Game CSA, mae llawer o ymchwilwyr wedi ceisio datblygu pobl eraill "gemau gyda phwrpas" (Ahn and Dabbish 2008) (hy, "gemau cyfrifiannu seiliedig dynol-" (Pe-Than, Goh, and Lee 2015) ) y gall fod a ddefnyddir i ddatrys amrywiaeth o broblemau eraill. Yr hyn y "gemau gyda phwrpas" yn gyffredin yw eu bod yn ceisio gwneud y tasgau sy'n gysylltiedig â cyfrifiant dynol pleserus. Felly, tra bod y gêm CSA rhannu'r hollt-ymgeisio-cyfuno un strwythur gyda Galaxy Sw, mae'n wahanol yn y ffordd y cyfranogwyr yn cael eu hysgogi-hwyl vs awydd i helpu gwyddoniaeth.

Mae fy disgrifiad o Galaxy Sw yn tynnu ar Nielsen (2012) , Adams (2012) , Clery (2011) , a Hand (2010) , ac mae fy cyflwyniad y nodau ymchwil Galaxy Sw ei symleiddio. Am fwy ar hanes dosbarthiad galaeth mewn seryddiaeth a sut Galaxy Sw yn parhau traddodiad hwn, gweler Masters (2012) a Marshall, Lintott, and Fletcher (2015) . Gan adeiladu ar Galaxy Sw, mae'r ymchwilwyr cwblhau Galaxy Sw 2 oedd yn casglu mwy na 60 miliwn yn fwy dosbarthiadau morffolegol cymhleth o wirfoddolwyr (Masters et al. 2011) . Bellach, maent yn estyn allan i broblemau y tu allan i morffoleg galaeth gan gynnwys edrych ar wyneb y lleuad, yn chwilio am blanedau, a drawsgrifio hen ddogfennau. Ar hyn o bryd, mae eu holl brosiectau yn cael eu casglu ar www.zooniverse.org (Cox et al. 2015) . Un o'r prosiectau-Ciplun Serengeti-yn darparu tystiolaeth y gall prosiectau dosbarthiad image Galaxy Sw-fath hefyd yn cael ei wneud ar gyfer ymchwil amgylcheddol (Swanson et al. 2016) .

Ar gyfer ymchwilwyr bwriadu defnyddio marchnad lafur micro-dasg (ee, Amazon Mecanyddol Turk) ar gyfer prosiect cyfrifiant dynol, Chandler, Paolacci, and Mueller (2013) a Wang, Ipeirotis, and Provost (2015) yn cynnig cyngor da ar ddylunio tasg a materion cysylltiedig eraill.

Ymchwilwyr sydd â diddordeb mewn creu hyn yr wyf wedi elwir yn systemau cyfrifiant dynol ail genhedlaeth (ee, systemau sy'n defnyddio labeli dynol i hyfforddi model dysgu beiriant) allai fod â diddordeb mewn Shamir et al. (2014) (er enghraifft trwy ddefnyddio sain) a Cheng and Bernstein (2015) . Hefyd, gall y prosiectau hyn yn cael ei wneud â galwadau agored, lle mae ymchwilwyr yn cystadlu i greu modelau dysgu peiriant gyda pherfformiad rhagfynegol mwyaf. Er enghraifft, cynhaliodd y tîm Galaxy Sw galwad agored a dod o hyd i ddull newydd sy'n perfformio'n well na'r un a ddatblygwyd yn Banerji et al. (2010) ; gweld Dieleman, Willett, and Dambre (2015) am fanylion.

  • Galwadau Agored (Adran 5.3)

Nid yw galwadau Agored yn newydd. Yn wir, un o'r galwadau agored mwyaf adnabyddus yn dyddio'n ôl i 1714 pan grëwyd y Senedd Prydain Gwobr Hydred ar gyfer unrhyw un a allai ddatblygu ffordd i benderfynu ar y hydred llong ar y môr. Y broblem stumped llawer o'r gwyddonwyr mwyaf y dyddiau, yn cynnwys Isaac Newton, a'r ateb buddugol ei gyflwyno yn y pen draw gan clociwr o gefn gwlad a oedd wedi cysylltu â'r broblem yn wahanol i wyddonwyr a oedd yn canolbwyntio ar ateb a fyddai'n rhywsut golygu seryddiaeth (Sobel 1996) . Gan fod yr enghraifft hon yn dangos, un rheswm pam y credir galwadau agored i weithio mor dda yw eu bod yn darparu mynediad i bobl sydd â gwahanol safbwyntiau a sgiliau (Boudreau and Lakhani 2013) . Gweler Hong and Page (2004) a Page (2008) am fwy ar werth amrywiaeth mewn datrys problemau.

Mae pob un o'r achosion galwad agored yn y bennod yn gofyn ychydig o eglurhad pellach ar gyfer pam mae'n perthyn yn y categori hwn. Yn gyntaf, un ffordd yr wyf yn gwahaniaethu rhwng prosiectau galwad agored cyfrifiant dynol a yw p'un a yw'r cynnyrch yn gyfartaledd o'r holl atebion (cyfrifiant dynol) neu yr ateb gorau (galwad agored). Gwobr Netflix braidd yn anodd yn y cyswllt hwn oherwydd bod yr ateb gorau drodd allan i fod yn gyfartaledd soffistigedig o atebion unigol, mae enw yr aed atynt ateb ensemble (Bell, Koren, and Volinsky 2010; Feuerverger, He, and Khatri 2012) . O safbwynt Netflix, fodd bynnag, i gyd roedd yn rhaid iddynt ei wneud oedd ddewis yr ateb gorau.

Yn ail, gan rai diffiniadau o gyfrifiannu dynol (ee, Von Ahn (2005) ), FoldIt dylid ystyried prosiect cyfrifiant dynol. Fodd bynnag, yr wyf yn dewis i gategoreiddio FoldIt fel galwad agored am ei fod yn gofyn am sgiliau arbenigol ac mae'n cymryd cyfrannodd yr ateb gorau, yn hytrach na defnyddio hollt-ymgeisio-cyfuno strategaeth.

Yn olaf, gellid dadlau bod Cymheiriaid-i-Patent yn enghraifft o gasglu data a ddosbarthwyd. Rwy'n dewis i'w gynnwys fel galwad agored oherwydd mae ganddo strwythur cystadleuaeth tebyg a dim ond y cyfraniadau gorau yn cael eu defnyddio (ond gyda chasglu data a ddosbarthwyd, y syniad o gyfraniadau da a drwg yn llai clir).

I gael gwybod mwy am y Wobr Netflix, gweler Bennett and Lanning (2007) , Thompson (2008) , Bell, Koren, and Volinsky (2010) , a Feuerverger, He, and Khatri (2012) . I gael rhagor o wybodaeth am FoldIt weld, Cooper et al. (2010) , Andersen et al. (2012) , a Khatib et al. (2011) ; fy disgrifiad o FoldIt tynnu ar ddisgrifiadau yn Nielsen (2012) , Bohannon (2009) , a Hand (2010) . Am fwy ar Cymheiriaid-i-Patent, gweler Noveck (2006) , Bestor and Hamp (2010) , Ledford (2007) , a Noveck (2009) .

Yn debyg i'r canlyniadau Glaeser et al. (2016) , Mayer-Schönberger and Cukier (2013) , Pennod 10 adroddiadau enillion mawr yn y cynhyrchiant o arolygwyr tai yn Ninas Efrog Newydd pan arolygiadau yn cael eu harwain gan fodelau rhagfynegol. Yn Ninas Efrog Newydd, modelau rhagfynegi hyn eu hadeiladu gan weithwyr y ddinas, ond mewn achosion eraill, gallai un ddychmygu y gellid eu creu neu eu gwella gyda galwadau agored (ee, Glaeser et al. (2016) ). Fodd bynnag, un pryder mawr gyda modelau rhagfynegol yn cael eu defnyddio i ddyrannu adnoddau yw bod y modelau sydd â'r potensial i atgyfnerthu rhagfarnau sydd eisoes yn bodoli. Mae llawer o ymchwilwyr eisoes yn gwybod "garbage mewn, garbage allan", a gyda modelau rhagfynegol gall fod yn "rhagfarn mewn, tuedd allan." Gweler Barocas and Selbst (2016) a O'Neil (2016) am fwy ar beryglon modelau rhagfynegol a adeiladwyd gyda data hyfforddi rhagfarnllyd.

Un broblem a allai atal llywodraethau rhag defnyddio cystadlaethau agored yw ei fod yn ei gwneud yn ofynnol rhyddhau data, a allai arwain at droseddau preifatrwydd. Am fwy o wybodaeth am breifatrwydd a rhyddhau data yn y galwadau agored gweler Narayanan, Huey, and Felten (2016) a'r drafodaeth ym Mhennod 6.

  • Casglu data Gwasgaredig (Adran 5.4)

Mae fy disgrifiad o eBird tynnu ar ddisgrifiadau yn Bhattacharjee (2005) a Robbins (2013) . Am fwy ar sut mae ymchwilwyr yn defnyddio modelau ystadegol i ddadansoddi data eBird gweld Hurlbert and Liang (2012) a Fink et al. (2010) . Am fwy ar hanes gwyddoniaeth dinesydd mewn ornothology, gweler Greenwood (2007) .

I gael gwybod mwy am y Prosiect Cylchgronau Malawi, gweler Watkins and Swidler (2009) a Kaler, Watkins, and Angotti (2015) . Ac am fwy ar brosiect cysylltiedig yn Ne Affrica, gweler Angotti and Sennott (2015) . I gael mwy o enghreifftiau o ddata ymchwil gan ddefnyddio o Brosiect Malawi Journals gweler Kaler (2004) a Angotti et al. (2014) .

  • Dylunio eich hun (Adran 5.5)

Fy dull o gynnig cyngor dyluniad yn anwythol, yn seiliedig ar yr enghreifftiau o lwyddiannus ac wedi methu prosiectau cydweithio màs yr wyf wedi clywed am. Mae yna hefyd ffrwd o waith ymchwil yn ceisio cymhwyso theorïau seicolegol cymdeithasol yn fwy cyffredinol i ddylunio cymunedau ar-lein sydd yn berthnasol i ddyluniad prosiectau cydweithio torfol, gweler, er enghraifft, Kraut et al. (2012) .

O ran cymell cyfranogwyr, mae'n mewn gwirionedd yn eithaf anodd i chyfrif i maes yn union pam fod pobl yn cymryd rhan mewn prosiectau cydweithio màs (Nov, Arazy, and Anderson 2011; Cooper et al. 2010, Raddick et al. (2013) ; Tuite et al. 2011; Preist, Massung, and Coyle 2014) . Os ydych yn bwriadu i ysgogi cyfranogwyr gyda thaliad ar farchnad lafur micro-dasg (ee, Amazon Mecanyddol Turk) Kittur et al. (2013) yn cynnig rhywfaint o gyngor.

O ran galluogi syndod, am fwy o enghreifftiau o ddarganfyddiadau annisgwyl yn dod allan o brosiectau Zoouniverse, gweler Marshall, Lintott, and Fletcher (2015) .

O ran bod yn foesegol, mae rhai cyflwyniadau cyffredinol da i'r materion dan sylw yn Gilbert (2015) , Salehi et al. (2015) , Schmidt (2013) , Williamson (2016) , Resnik, Elliott, and Miller (2015) , a Zittrain (2008) . Ar gyfer materion sy'n ymwneud yn benodol â materion cyfreithiol gyda chyflogeion dorf, gweler Felstiner (2011) . O'Connor (2013) yn mynd i'r afael cwestiynau am oruchwylio moesegol ymchwil pan rolau ymchwilwyr a chyfranogwyr aneglur. Ar gyfer materion yn ymwneud â rhannu data tra'n diogelu participats mewn prosiectau gwyddoniaeth dinasyddion, gweler Bowser et al. (2014) . Mae'r ddau Purdam (2014) a Windt and Humphreys (2016) yn cael rhywfaint o drafodaeth am y materion moesegol wrth gasglu data a ddosbarthwyd. Yn olaf, mae'r rhan fwyaf o brosiectau yn cydnabod cyfraniadau ond peidiwch â rhoi credyd awduraeth i gyfranogwyr. Yn Foldit, y chwaraewyr Foldit aml rhestredig yn cael eu fel awdur (Cooper et al. 2010; Khatib et al. 2011) . Mewn prosiectau galwad agored eraill, gall y cyfrannwr buddugol yn aml yn ysgrifennu papur yn disgrifio eu datrysiadau (ee, Bell, Koren, and Volinsky (2010) a Dieleman, Willett, and Dambre (2015) ). Yn y teulu Galaxy Zoo o brosiectau, cyfranwyr yn hynod o weithgar ac yn bwysig weithiau eu gwahodd i fod yn gyd-awduron ar bapurau. Er enghraifft, roedd Ivan Terentev a Tim Matorny, dau o gyfranogwyr Radio Galaxy Sw o Rwsia, gyd-awduron ar un o'r papurau a gododd o'r prosiect hwnnw (Banfield et al. 2016; Galaxy Zoo 2016) .