հետագա մեկնաբանություն

Այս բաժինը նախատեսված է օգտագործվել որպես հղում, այլ ոչ թե պետք է կարդալ որպես պատմածից:

  • Ներածություն (Բաժին 5.1)

Զանգվածային համագործակցությունը blends գաղափարներ քաղաքացի գիտության, crowdsourcing, եւ կոլեկտիվ հետախուզական. Քաղաքացի գիտության սովորաբար նշանակում ներգրավելով «քաղաքացիներին» (այսինքն, ոչ գիտնականներ) գիտական գործընթացի (Crain, Cooper, and Dickinson 2014) : Քրաուդսորսինգի սովորաբար նշանակում է, որ խնդիր է սովորաբար լուծվում կազմակերպության ներսում եւ դրա փոխարեն աութսորսինգ այն ամբոխի (Howe 2009) : Հավաքական հետախուզական սովորաբար նշանակում խմբեր անհատների գործող կոլեկտիվ այնպես, որ կարծես խելացի (Malone and Bernstein 2015) : Nielsen (2012) հանդիսանում է հրաշալի գիրք երկարությունը ներդրումը մեջ իշխանության զանգվածային համագործակցության համար գիտական հետազոտությունների:

Կան բազմաթիվ տեսակներ զանգվածային համագործակցության, որոնք չեն տեղավորվում neatly մեջ երեք կատեգորիաների, որ ես առաջարկվող, եւ ես կարծում եմ, որ երեք արժանի են հատուկ ուշադրության, քանի որ նրանք կարող են օգտակար լինել սոցիալական հետազոտությունների ինչ - որ պահի. Մեկ օրինակ է կանխատեսման շուկաները, որտեղ մասնակիցները գնել եւ առեւտրային պայմանագրերը, որոնք ենթակա են մարման վրա հիմնված արդյունքների, որոնք տեղի են ունենում աշխարհում (Wolfers and Zitzewitz 2004; Arrow et al. 2008) : Կանխատեսելով շուկաները հաճախ օգտագործվում են ընկերությունների եւ կառավարությունների համար կանխատեսման, եւ կանխագուշակման շուկաները են նաեւ օգտագործվում է սոցիալական հետազոտողների կանխատեսել վերարտադրողականությանը հրատարակված հետազոտությունների հոգեբանության (Dreber et al. 2015) :

Երկրորդ օրինակը, որը չի տեղավորվում լավ է իմ դասակարգման սխեմայի է PolyMath նախագիծը, որտեղ հետազոտողները համագործակցել օգտագործելով եւ Wikis են ապացուցել, նոր մաթեմատիկական թեորեմները (Gowers and Nielsen 2009; Cranshaw and Kittur 2011; Nielsen 2012; Kloumann et al. 2016) : The PolyMath նախագիծ է որոշ առումներով նման է Netflix մրցանակի, բայց PolyMath ծրագրի մասնակիցների ավելի ակտիվ կառուցվել է մասնակի լուծումների ուրիշների.

Երրորդ օրինակը, որը չի տեղավորվում լավ է իմ դասակարգման սխեմայի Ժամանակն է, կախված զորակոչերից, ինչպիսիք են պաշտպանության Ընդլայնված գիտահետազոտական ​​նախագծերի գործակալության (DARPA) ցանցի Challenge (այսինքն, Կարմիր Balloon Challenge). Ավելի այդ ժամանակ զգայուն զորակոչերից տեսնել, Pickard et al. (2011) , Tang et al. (2011) , եւ Rutherford et al. (2013) :

  • Human հաշվարկն (Բաժին 5.2)

Տերմինը, «Մարդկային հաշվարկ» դուրս է գալիս կատարած աշխատանքի համակարգչային գիտնականների եւ հասկանալու ենթատեքստ այս հետազոտության կբարելավի ձեր կարողությունը ընտրել դուրս խնդիրները, որոնք կարող են պատասխանատու այն. For որոշ խնդիրների, համակարգիչներ են աներեւակայելի հզոր կարողությունների հեռու գերազանցող նույնիսկ փորձագիտական ​​մարդկանց. Օրինակ, շախմատում, համակարգիչները կարող է հաղթել նույնիսկ լավագույն գրոսմայստերներ: Բայց եւ դա ավելի լավ է գնահատվում են հասարակագետների համար այլ խնդիրների, համակարգիչները, ըստ էության, շատ ավելի վատ է, քան մարդկանց. Այլ կերպ ասած, հենց հիմա դուք ավելի լավ են, քան նույնիսկ առավել բարդ համակարգչի որոշակի առաջադրանքների ընդգրկող պատկերների մշակումը, վիդեո, աուդիո, եւ տեքստը: Այսպիսով, ինչպես էր պատկերազարդ է հրաշալի XKCD մուլտֆիլմ-կան խնդիրներ, որոնք հեշտ է համակարգիչների եւ դժվար մարդկանց համար, բայց կան նաեւ խնդիրներ, որոնք դժվար է համակարգիչների եւ հեշտ է մարդկանց համար (Գծապատկեր 5.13): Համակարգչային գիտնականները աշխատում դրանք դժվար համար համակարգիչների հեշտ համար մարդկային խնդիրների, հետեւաբար, հասկացել է, որ իրենք կարող են ներառել մարդկանց իրենց հաշվողական գործընթացում: Ահա թե ինչպես Լուիս ֆոն Ahn (2005) նկարագրված մարդու հաշվարկ, երբ նա առաջին անգամ եզրը իր ատենախոսության «պարադիգմը համար օգտագործելով մարդկային մշակման իշխանությունը լուծելու խնդիրներ, որոնք համակարգիչներ դեռեւս չի կարող լուծել»:

Նկար 5.13: Որոշ առաջադրանքների համակարգիչներ են զարմանալի է, գերազանցելով ունակությունը մարդու փորձագետների: Բայց, այլ առաջադրանքներ, հասարակ մարդիկ կարող outperform է նույնիսկ բարդ համակարգիչների համակարգեր. Խոշոր խնդիրներ, որոնք ներառում են խնդիրներ, որոնք դժվար է համակարգիչների եւ հեշտ է մարդկանց համար, որոնք նաեւ պիտանի համար մարդկային հաշվարկման. Օգտագործված ըստ ժամկետների նկարագրված այստեղ: http://xkcd.com/license.html

Նկար 5.13: Որոշ առաջադրանքների համակարգիչներ են զարմանալի է, գերազանցելով ունակությունը մարդու փորձագետների: Բայց, այլ առաջադրանքներ, հասարակ մարդիկ կարող outperform է նույնիսկ բարդ համակարգիչների համակարգեր. Խոշոր խնդիրներ, որոնք ներառում են խնդիրներ, որոնք դժվար է համակարգիչների եւ հեշտ է մարդկանց համար, որոնք նաեւ պիտանի համար մարդկային հաշվարկման. Օգտագործված ըստ ժամկետների նկարագրված այստեղ: http://xkcd.com/license.html

Ըստ այս սահմանման FoldIt, որն ես նկարագրված բաժնում բաց զանգեր, կարող է համարել մարդկային հաշվարկման ծրագիր է: Սակայն, ես ընտրել դասակարգումը FoldIt որպես բաց զանգի, քանի որ այն պահանջում է մասնագիտական ​​հմտություններ, եւ դա տեւում է լավագույն լուծումը նպաստել փոխարեն օգտագործելով պառակտման դիմել-համատեղել ռազմավարություն.

For հիանալի գիրք երկարությամբ բուժման մարդկային հաշվարկում է, առավել ընդհանուր իմաստով ժամկետով, տես Law and Ahn (2011) : Գ Լ ՈՒ Խ 3- Law and Ahn (2011) , Ունի մի հետաքրքիր քննարկում ավելի բարդ միավորել քայլերի, քան նորերը այս գլխում.

Տերմինը, «պառակտումը-կիրառվում-համատեղել» օգտագործվում է Wickham (2011) Ինչպես նկարագրել է ռազմավարություն վիճակագրական computing, բայց դա կատարելապես գրավում գործընթացը բազմաթիվ մարդկային հաշվարկային նախագծերի: Պառակտման դիմել-համատեղել ռազմավարությունը նման է MapReduce շրջանակներում մշակված Google (Dean and Ghemawat 2004; Dean and Ghemawat 2008) :

Երկու խելացի մարդու հաշվարկային նախագծերը, որոնք ես չէի ունենա տարածք քննարկելու են ESP Game (Ahn and Dabbish 2004) Եւ reCAPTCHA (Ahn et al. 2008) : Երկուսն էլ այդ ծրագրերի գտել ստեղծագործական ուղիներ դրդել մասնակիցներին տրամադրել պիտակների վրա պատկերների. Սակայն, այդ երկու նախագծերի նաեւ բարձրացրել էթիկական հարցերին, քանի որ, ի տարբերություն Galaxy Zoo, մասնակիցները ESP խաղ եւ reCAPTCHA -ով չգիտեին, թե ինչպես են իրենց տվյալները օգտագործվում էր (Lung 2012; Zittrain 2008) :

Ոգեշնչված ESP խաղ, շատ հետազոտողներ փորձել են զարգացնել ուրիշներին «Խաղեր նպատակով» (Ahn and Dabbish 2008) (այսինքն, «մարդու վրա հիմնված հաշվարկային խաղեր» (Pe-Than, Goh, and Lee 2015) ), որը կարող է լինել օգտագործվում է լուծել մի շարք այլ խնդիրների: Թե ինչ է այդ «Խաղեր նպատակով» ունեն ընդհանուր է, որ նրանք փորձում են կատարել առաջադրանքները, որոնք ներգրավված են մարդու հաշվարկի հաճելի: Այսպիսով, իսկ ESP Game կիսում են նույն Պառակտման կիրառվում-միավորել կառույց Galaxy Zoo, այն տարբերվում է, թե ինչպես են մասնակիցները մոտիվացված-fun ընդդեմ ցանկությունից օգնել գիտությունը:

Իմ նկարագրությունը Galaxy կենդանաբանական այգու ոքի է Nielsen (2012) , Adams (2012) , Clery (2011) , եւ Hand (2010) , եւ իմ ներկայացում հետազոտական ​​նպատակներից Galaxy կենդանաբանական այգու էր պարզեցվել: Համար ավելի շատ պատմության Գալաքսի դասակարգման աստղագիտության, եւ թե ինչպես է Galaxy Zoo շարունակում են այս ավանդույթը, տես Masters (2012) եւ Marshall, Lintott, and Fletcher (2015) : Շենք Galaxy Zoo, հետազոտողները ավարտվել Galaxy Zoo 2 որը հավաքել է ավելի քան 60 միլիոն դոլարով ավելի բարդ ձեւաբանական դասակարգումները կամավորների (Masters et al. 2011) : Բացի այդ, նրանք branched դուրս խնդիրների դուրս Գալաքսի ձեւաբանության, այդ թվում ուսումնասիրել մակերեսի լուսնի, փնտրում մոլորակները, եւ վերարտադրելիս հին փաստաթղթեր: Ներկայում նրանց բոլոր ծրագրերը, որոնք հավաքվում են www.zooniverse.org (Cox et al. 2015) : Մեկը ծրագրերից պատկերը Serengeti-փաստում է, որ Galaxy Zoo-type պատկերը դասակարգման ծրագրերը նույնպես կարող է անել բնապահպանական հետազոտության (Swanson et al. 2016) :

For հետազոտողները մտադիր են օգտագործել է միկրո- աշխատանքային աշխատաշուկան (օրինակ, Amazon Mechanical Turk) համար մարդու հաշվարկային նախագծի, Chandler, Paolacci, and Mueller (2013) եւ Wang, Ipeirotis, and Provost (2015) Առաջարկել լավ խորհուրդներ խնդիրն դիզայնի եւ այլ հարցերի շուրջ.

Հետազոտողները հետաքրքրված ստեղծել այն, ինչ ես կոչված երկրորդ սերնդի մարդկային հաշվարկի համակարգեր (օրինակ, համակարգեր, որոնք օգտագործում են մարդկային պիտակներ պատրաստել մի մեքենա ուսուցման մոդելը) կարող է հետաքրքրել Shamir et al. (2014) համար (օրինակ `օգտագործելով աուդիո) եւ Cheng and Bernstein (2015) : Բացի այդ, այդ ծրագրերը կարելի է անել բաց զանգերի, որով հետազոտողները մրցել է ստեղծել մեքենա ուսուցման մոդելների հետ մեծագույն կանխատեսող կատարման. Օրինակ, Galaxy Zoo թիմը վազեց բաց զանգը եւ գտել է մի նոր մոտեցում, որը outperformed մեկը, զարգացած է Banerji et al. (2010) ; տես, Dieleman, Willett, and Dambre (2015) մանրամասների համար:

  • Բաց զանգեր (Հատված 5.3)

Բաց զանգերը նոր չեն: Ի դեպ, մեկն է առավել հայտնի բաց զանգերի թվագրվում է 1714, երբ Մեծ Բրիտանիայի խորհրդարանը ստեղծվել է երկայնությունը մրցանակի որեւէ մեկի համար, որը կարող է զարգացնել ճանապարհ որոշելու երկայնությունը մի նավ ծովում: Խնդիրն stumped շատերը մեծագույն գիտնականների այն օրերի, այդ թվում Իսահակ Նյուտոնը, եւ հաղթող լուծումը, ի վերջո, ներկայացվել է clockmaker է ծայրամաս, ովքեր մոտեցել խնդիրը այլ կերպ գիտնականների, որոնք կենտրոնացած է մի լուծում, որը ինչ-որ կերպ ներգրավել Աստղագիտություն (Sobel 1996) . Քանի որ այս օրինակը ցույց է տալիս, պատճառներից մեկը, որ բաց զանգերը, որոնք մտածում են աշխատում, այնքան լավ է, որ նրանք ապահովել մուտք մարդկանց տարբեր տեսանկյուններից եւ հմտություններ (Boudreau and Lakhani 2013) : Տես Hong and Page (2004) եւ Page (2008) համար ավելի արժեքի բազմազանության խնդրի լուծման:

Յուրաքանչյուր բաց զանգի դեպքերում գլխի պահանջում է մի քիչ հետագա բացատրություն, թե ինչու դա պատկանում այս կատեգորիայում. Նախ, մեկ ճանապարհ, որ ես տարբերել մարդկային հաշվումների եւ բաց մրցույթ նախագծերի այն է, թե արտադրանքը միջինը բոլոր լուծումներին (մարդու հաշվարկման) կամ լավագույն լուծումը (բաց զանգի): The Netflix մրցանակ որոշ չափով բարդ է այս առումով, քանի որ լավագույն լուծումը պարզվել է, որ մի բարդ միջին անհատական ​​լուծումներ, որը մոտեցել կոչվում է համույթը լուծում (Bell, Koren, and Volinsky 2010; Feuerverger, He, and Khatri 2012) : Տեսանկյունից Netflix, սակայն, բոլոր նրանք ստիպված են անել, որ ընտրել է լավագույն լուծումը:

Երկրորդ, ըստ որոշ սահմանումների մարդկային հաշվարկում (օրինակ, Von Ahn (2005) ), FoldIt պետք է դիտարկել որպես մարդկային հաշվարկման ծրագիր է: Սակայն, ես ընտրել դասակարգումը FoldIt որպես բաց զանգի, քանի որ այն պահանջում է մասնագիտական ​​հմտություններ, եւ դա տեւում է լավագույն լուծումը նպաստել, այլ ոչ թե օգտագործելով պառակտման դիմել-համատեղել ռազմավարություն.

Վերջապես, կարելի է պնդել, որ Peer-to-Արտոնագրի օրինակ է, բաժանվում տվյալների հավաքագրման. Ես ընտրել եմ ներառել այն որպես բաց զանգի, քանի որ այն ունի մրցույթ նման կառույց եւ միայն լավագույն ներդրումը, որոնք օգտագործվում են (իսկ, ինչպես բաշխված տվյալների հավաքագրման, գաղափարը լավ ու վատ ներդրումները քիչ պարզ):

Համար ավելի է Netflix մրցանակի, տես Bennett and Lanning (2007) , Thompson (2008) , Bell, Koren, and Volinsky (2010) , եւ Feuerverger, He, and Khatri (2012) : Համար ավելի FoldIt տեսնել, Cooper et al. (2010) , Andersen et al. (2012) , եւ Khatib et al. (2011) ; Իմ նկարագրությունը FoldIt ոքի նկարագրությունները Nielsen (2012) , Bohannon (2009) , եւ Hand (2010) : For ավելի peer-to-արտոնագրային, տես Noveck (2006) , Bestor and Hamp (2010) , Ledford (2007) , եւ Noveck (2009) :

Նմանատիպ արդյունքներով Glaeser et al. (2016) , Mayer-Schönberger and Cukier (2013) , Գլուխ 10 հաղորդումներ խոշոր ձեռքբերումները արտադրողականության բնակարանային տեսուչների Նյու Յորքում, երբ ստուգումներ են առաջնորդվում կանխատեսող մոդելներ. Ին Նյու Յորքում, այդ կանխատեսող մոդելները, որոնք կառուցվել են քաղաքի աշխատակիցների համար, սակայն այլ դեպքերում, կարելի էր պատկերացնել, որ նրանք կարող են ստեղծել կամ բարելավվել բաց զանգերի (օրինակ, Glaeser et al. (2016) ): Սակայն, մեկ հիմնական մտահոգությունը կանխատեսող մոդելները, որոնք օգտագործվում են միջոցներ տրամադրել այն է, որ մոդելներն ունեն ներուժ ամրապնդելու առկա նախապաշարումներով: Շատ հետազոտողներ արդեն գիտենք, "աղբը, աղբը դուրս», եւ կանխատեսող մոդելներ, դա կարող է լինել «կողմնակալ է, կողմնակալությունը դուրս»: Տես Barocas and Selbst (2016) Եւ O'Neil (2016) Համար ավելի շատ վտանգների կանխատեսման մոդելներ կառուցվել ինչպես կանխորոշված ​​վերապատրաստման տվյալները.

Մեկ խնդիրը, որը կարող է կանխել կառավարություններին, օգտագործելով բաց մրցույթներ այն է, որ պահանջում է տվյալների ազատ արձակել, որը կարող է հանգեցնել գաղտնիության խախտումներին: Ավելի մոտ գաղտնիության եւ տվյալների ազատ արձակման բաց զանգերի համար տես Narayanan, Huey, and Felten (2016) Եւ քննարկումը 6-րդ գլխում.

  • Բաշխված տվյալների հավաքագրման (Բաժին 5.4)

Իմ նկարագրությունը eBird ոքի նկարագրությունները Bhattacharjee (2005) Եւ Robbins (2013) : Ավելի շատ, թե ինչպես հետազոտողները օգտագործել վիճակագրական մոդելներ վերլուծել eBird տվյալների տեսնել, Hurlbert and Liang (2012) եւ Fink et al. (2010) : Համար ավելի շատ պատմության քաղաքացի գիտության ornothology, տես Greenwood (2007) :

Համար ավելի է Մալավի Ամսագրեր ծրագրի, տես Watkins and Swidler (2009) , եւ Kaler, Watkins, and Angotti (2015) : Իսկ դրա համար ավելի շատ հարակից ծրագրի Հարավային Աֆրիկայում, տես Angotti and Sennott (2015) : For more օրինակներից հետազոտական ​​օգտագործելով տվյալների Մալավի Ամսագրեր ծրագրի տեսնել, Kaler (2004) Եւ Angotti et al. (2014) :

  • Նախագծման Ձեր սեփական (Բաժին 5.5)

Իմ մոտեցումը, որն առաջարկում է նախագծային խորհուրդներ էր ինդուկտիվ հիման վրա օրինակներից հաջողված եւ ձախողվել զանգվածային համագործակցության ծրագրերը, որոնք ես լսել: Կա նաեւ մի հոսք հետազոտության փորձում է կիրառել ավելի ընդհանուր սոցիալ-հոգեբանական տեսությունների նախագծման առցանց համայնքներ, որոնք համապատասխանում է նախագծման զանգվածային համագործակցության նախագծերի, տես, օրինակ, Kraut et al. (2012) :

Ինչ վերաբերում պատճառաբանելով մասնակիցների, այն է, ըստ էության, բավականին բարդ է պարզել, թե ինչու են մարդիկ մասնակցում են զանգվածային համագործակցության նախագծերում (Nov, Arazy, and Anderson 2011; Cooper et al. 2010, Raddick et al. (2013) ; Tuite et al. 2011; Preist, Massung, and Coyle 2014) : Եթե Դուք պլանավորում եք դրդել մասնակիցներին վճարման վրա միկրո- աշխատանքային աշխատաշուկայում (օրինակ, Amazon Mechanical Turk) Kittur et al. (2013) Առաջարկում է մի քանի խորհուրդ.

Ինչ վերաբերում է հնարավորություն տալով անակնկալ է, ավելի օրինակներից անսպասելի հայտնագործությունների դուրս գալու Zoouniverse նախագծերի, տես Marshall, Lintott, and Fletcher (2015) :

Ինչ վերաբերում է լինելու բարոյական, որոշ լավ ընդհանուր Introductions հիմնախնդիրներին ներգրավված են Gilbert (2015) , Salehi et al. (2015) , Schmidt (2013) , Williamson (2016) , Resnik, Elliott, and Miller (2015) , Եւ Zittrain (2008) : Հարցերի, մասնավորապես, կապված իրավական խնդիրների հետ ամբոխի աշխատակիցների, տես Felstiner (2011) : O'Connor (2013) անդրադառնում վերաբերյալ հարցերին էթիկական վերահսկողության հետազոտությունների երբ դերերը հետազոտողների եւ մասնակիցների նսեմացնել. Հետ կապված հարցերի փոխանակման տվյալների պաշտպանելով մասնակիցներ են քաղաքացու գիտական ​​նախագծերի, տես Bowser et al. (2014) : Երկուսն էլ Purdam (2014) եւ Windt and Humphreys (2016) Պետք է որոշակի քննարկում մասին էթիկական խնդիրներին բաշխված տվյալների հավաքագրման. Վերջապես, շատ նախագծեր ընդունում են ներդրումները, սակայն չեն տալիս Հեղինակային վարկ մասնակիցներին: Ի Foldit, որ Foldit ֆուտբոլիստները հաճախ են նշված որպես հեղինակի (Cooper et al. 2010; Khatib et al. 2011) : Այլ կերպ բաց մրցույթ նախագծերի, հաղթող ուղղում կարող է հաճախ գրել թղթի նկարագրող իրենց լուծումները (օրինակ, Bell, Koren, and Volinsky (2010) եւ Dieleman, Willett, and Dambre (2015) ): Ի Galaxy գազանանոցում ընտանիքում նախագծերի, չափազանց ակտիվ եւ կարեւոր ներդրում են երբեմն անձինք հրավիրվել են լինել համահեղինակներ են թղթի վրա: Օրինակ, Իվան Terentev եւ Թիմ Matorny, երկու Ռադիո Galaxy Zoo մասնակիցներ Ռուսաստանից, եղել համահեղինակներ մեկի վրա թղթերի, որոնք ծագել են այդ նախագծի (Banfield et al. 2016; Galaxy Zoo 2016) :