Допълнителна коментар

Този превод е създаден от компютър. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

Допълнителна коментар

Този раздел е предназначен да се използва като отправна точка, а не да се чете като разказ.

Въведение (раздел 5.1)

Mass сътрудничество съчетава идеи от гражданин на науката, краудсорсинг, и колективна интелигентност. Citizen наука обикновено означава включващ "гражданите" (т.е., които не са учени) в научния процес (Crain, Cooper, and Dickinson 2014) . Crowdsourcing обикновено означава да се вземат проблем обикновено решен в рамките на една организация, а вместо това аутсорсинг на тълпата (Howe 2009) . Колективен интелект обикновено означава групи от лица, действащи заедно по начин, който изглежда интелигентен (Malone and Bernstein 2015) . Nielsen (2012) е въведение една чудесна книга дължина под властта на маса сътрудничество за научни изследвания.

Има много видове маса сътрудничество, които не пасват в трите категории, които аз предложени, и мисля, че три заслужават специално внимание, тъй като те могат да бъдат полезни в социални изследвания в някакъв момент. Един пример е информационни пазари, където участниците купуват и търговски договори, които са договорени за ползване на базата на резултатите, които се случват в света (Wolfers and Zitzewitz 2004; Arrow et al. 2008) . Прогнозиране пазари често се използват от фирми и правителства за прогнозиране, и предвиждат пазари също са били използвани от социалните изследователи да се предскаже възпроизводимостта на публикувани изследвания в областта на психологията (Dreber et al. 2015) .

Втори пример, че не се вписва добре в моя схема категоризация е проект на енциклопедист, където изследователите сътрудничили с помощта на блогове и уикита да докаже нови математически теореми (Gowers and Nielsen 2009; Cranshaw and Kittur 2011; Nielsen 2012; Kloumann et al. 2016) . Проектът Polymath е в някои отношения, подобни на наградата Netflix, но в участниците в Polymath проекта по-активно построен върху частичните решения на другите.

Третият пример, който не се вписва добре в моя схема категоризация е време-зависими мобилизации като Advanced Research агенция по отбраната проекти (DARPA) Network Challenge (т.е., Red Balloon предизвикателство). За повече информация относно тези време чувствителни мобилизации виждат Pickard et al. (2011) , Tang et al. (2011) , и Rutherford et al. (2013) .

Human изчисление (раздел 5.2)

Терминът "човешки изчисление" излиза на работата, извършена от компютърни специалисти, и разбиране на контекста зад това изследване ще подобри способността си да избирам проблеми, които могат да бъдат податливи на това. За някои задачи, компютри са невероятно мощни с възможности далеч надхвърлящи дори експертни хора. Например, в шах, компютри може да победи дори най-добрите гранд майстори. Но-и това е по-малко добре оценено от социалните учени-за други задачи, компютри са всъщност много по-лоши, отколкото хората. С други думи, в момента сте по-добре, отколкото дори най-сложните компютъра на определени задачи, свързани с обработка на изображения, видео, аудио и текст. По този начин, както е илюстрирано с прекрасна Xkcd карикатура-има задачи, които са лесни за компютри и трудно за хората, но също така има задачи, които са трудни за компютри и лесно за хората (Фигура 5.13). Компютърни учени, работещи по тези трудни за-компютри-лесни за-човешки задачи, следователно, осъзнах, че те биха могли да включват хората в тяхната изчислителна процес. Ето как Луис фон Ан (2005) е описано по-човешки изчисление, когато той за пръв път въвежда термина в неговата дисертация: ". Парадигма за използване на човешката енергия за обработка за решаване на проблемите, които компютрите все още не могат да решат"

Фигура 5.13: За някои задачи компютри са невероятни, превишаваща способността на човешките експерти. Но, за други задачи, обикновените хора могат да превъзхождат дори сложни компютри системи. Големи проблеми мащаб, които включват задачи, които са трудни за компютри и лесен за хората са подходящи за човешка изчисление. Използва се в съответствие с условията, описани тук: http://xkcd.com/license.html

Чрез тази дефиниция FoldIt-, които описах в раздела за отворени покани-би могло да се счита за изчисляване проект човешки. Въпреки това, аз избирам да се категоризират FoldIt като открита покана, защото изисква специализирани умения и отнема най-доброто решение е допринесъл, а не с помощта на сплит-прилага-комбинират стратегия.

За отлична лечение дължина книга на човешкото изчисление, в най-общия смисъл на думата, виж Law and Ahn (2011) . Глава 3 от Law and Ahn (2011) има интересна дискусия на по-сложни съчетават стъпки, отколкото тези в тази глава.

Терминът "сплит-прилага-комбинират" е бил използван от Wickham (2011) , за да се опише стратегия за статистически изчисления, но перфектно улавя процеса на много проекти, човешки изчисляване. Разделен прилага-комбинират стратегия е подобна на рамката на MapReduce разработен в Google (Dean and Ghemawat 2004; Dean and Ghemawat 2008) .

Две умни изчислителни проекти на човека, че не разполагат с пространство, за да се обсъдят, са ESP Game (Ahn and Dabbish 2004) и Recaptcha (Ahn et al. 2008) . И на тези проекти намери творчески начини да мотивира участниците да предоставят етикети на изображения. Въпреки това, и двете от тези проекти също повдигнат етични въпроси, защото, за разлика от Galaxy Zoo, участници в ESP играта и Recaptcha не знаят как техните данни не е било използвано (Lung 2012; Zittrain 2008) .

Вдъхновен от ESP игра, много изследователи са се опитали да развият други "игри с цел" (Ahn and Dabbish 2008) (т.е., "човек-базирани изчислителни игри" (Pe-Than, Goh, and Lee 2015) ), който може да бъде използва за решаване на редица други проблеми. Това, което тези "игри с цел" са по-чести, е, че те се опитват да направят задачите, които участват в човешката изчисляване приятно. По този начин, докато ESP игра споделя същата разделен прилага-комбинират структура с Galaxy Zoo, то се различава от това как са участници мотивирани-забавно vs. желание да помогне на науката.

Моето описание на Galaxy Zoo равенства на Nielsen (2012) , Adams (2012) , Clery (2011) , и Hand (2010) , и моята презентация на изследователските цели на Galaxy Zoo е опростена. За повече информация относно историята на класификация галактика в астрономията и как Galaxy Zoo продължава тази традиция, виж Masters (2012) и Marshall, Lintott, and Fletcher (2015) . Изграждане на Galaxy Zoo, изследователите завършени Galaxy Zoo 2, който събира повече от 60 милиона по-сложни морфологични класификации от доброволци (Masters et al. 2011) . Освен това, те се преквалифицира в проблеми извън галактика морфология включително проучване на повърхността на Луната, търсене на планети, и записване на стари документи. В момента, всички техни проекти са събрани в www.zooniverse.org (Cox et al. 2015) . Един от проектите,-Snapshot Серенгети-представи доказателства, че проектите за класификация на изображението Galaxy Zoo-тип могат да бъдат изпълнени за изследване на околната среда (Swanson et al. 2016) .

За изследователите планират да използват пазарната микро-задача на труда (например, Amazon Mechanical Turk) за изчисляване на проект за човека, Chandler, Paolacci, and Mueller (2013) и Wang, Ipeirotis, and Provost (2015) предлагат добри съвети за дизайн задача и други свързани с това въпроси.

Изследователите се интересуват от създаването на това, което съм, наречен от второ поколение човешки изчислителни системи (например, системи, които използват човешки етикети да се обучават модел машина, обучение) могат да се интересуват Shamir et al. (2014) (за пример, използвайки аудио) и Cheng and Bernstein (2015) . Също така, тези проекти може да се направи с отворени покани, при което изследователите се конкурират за да се създаде машина за учене модели с най-голямо предсказуем изпълнение. Например, екипът на Galaxy Zoo изтича открита покана и намери нов подход, който надмина този, разработен в Banerji et al. (2010) ; виж Dieleman, Willett, and Dambre (2015) за повече подробности.

Отворени повиквания (точка 5.3)

Отворени покани не са нови. В действителност, един от най-добре познатите откритите процедури датира от 1714, когато британският парламент създаден Наградата дължина за всеки, който би могъл да разработи начин за определяне на географската дължина на кораб в морето. Проблемът озадачават много от най-великите учени на дните, в това число Исак Нютон, и в крайна сметка печели разтвор се подава от часовникар от провинцията, който се приближи към проблема по различен начин от учени, които са фокусирани върху решение, което по някакъв начин би довело астрономия (Sobel 1996) . Тъй като този пример показва, една от причините, че откритите покани се смята, че да се работи толкова добре, е, че те предоставят достъп до хора с различни гледни точки и умения (Boudreau and Lakhani 2013) . Вижте Hong and Page (2004) и Page (2008) за повече от стойността на многообразието в решаване на проблеми.

Всеки един от случаите на открита покана в главата изисква малко по-нататъшно обяснение защо тя принадлежи в тази категория. Първо, един начин, по който аз се прави разлика между човешки изчисления и проекти с отворен разговор е дали продукцията е средно от всички решения (човешки изчисление) или най-доброто решение (открита процедура). Наградата Netflix е малко по-сложно в това отношение, тъй като най-доброто решение се оказа сложна средно на индивидуални решения, като приближи нарича ансамбъл разтвор (Bell, Koren, and Volinsky 2010; Feuerverger, He, and Khatri 2012) . От гледна точка на Netflix, обаче, всички те трябваше да направя, беше да вземем най-доброто решение.

Второ, някои дефиниции на човешки изчисляване (например Von Ahn (2005) ), FoldIt трябва да се счита за изчисляване проект човека. Въпреки това, аз избирам да се категоризират FoldIt като открита покана, защото изисква специализирани умения и отнема най-доброто решение е допринесъл, а не с помощта на разделена прилага-комбинират стратегия.

И накрая, може да се твърди, че Peer-да-Patent е пример за разпределени за събиране на данни. Аз избирам да я включи като открита покана, защото има конкурс като структура и се използват само най-добрите вноски (има предвид, че с разпределени за събиране на данни, идеята за добри и лоши вноски е по-малко ясно).

За повече информация относно наградата Netflix, вижте Bennett and Lanning (2007) , Thompson (2008) , Bell, Koren, and Volinsky (2010) , и Feuerverger, He, and Khatri (2012) . За повече информация относно FoldIt видите, Cooper et al. (2010) , Andersen et al. (2012) , и Khatib et al. (2011) ; моето описание на FoldIt основава на описанията в Nielsen (2012) , Bohannon (2009) , и Hand (2010) . За повече информация относно Peer-да-Patent, вижте Noveck (2006) , Bestor and Hamp (2010) , Ledford (2007) , и Noveck (2009) .

Подобно на резултатите от Glaeser et al. (2016) , Mayer-Schönberger and Cukier (2013) , Глава 10 доклада големи печалби в производителността на жилищни инспектори в Ню Йорк, когато проверките се ръководят от прогнозни модели. В Ню Йорк, тези прогнозни модели са построени от служителите на града, но и в други случаи, човек може да си представите, че те биха могли да бъдат създадени или подобрени с отворени повиквания (например, Glaeser et al. (2016) ). Въпреки това, един основен проблем с прогнозни модели се използват за разпределяне на ресурси е, че моделите имат потенциала да засили съществуващите предразсъдъци. Много изследователи вече знаят "боклук в, боклука", и с прогнозни модели може да бъде "отклонение в, пристрастия навън." Вижте Barocas and Selbst (2016) и O'Neil (2016) за повече информация относно опасностите на прогнозни модели, построени с предубедени данни за обучение.

Един проблем, който може да попречи на правителствата да използват отворени конкурси е, че тя изисква освобождаване на данни, което може да доведе до нарушения на неприкосновеността на личния живот. За повече за неприкосновеността на личния живот и освобождаване на данни в отворени покани видите Narayanan, Huey, and Felten (2016) и дискусията в глава 6.

Разпределени събиране на данни (раздел 5.4)

Моето описание на eBird основава на описанията в Bhattacharjee (2005) и Robbins (2013) . За повече информация относно това как изследователите използват статистически модели за анализ на данни eBird виж Hurlbert and Liang (2012) и Fink et al. (2010) . За повече информация относно историята на гражданин на науката в ornothology, вижте Greenwood (2007) .

За повече информация относно Journals Проекта за Малави, вижте Watkins and Swidler (2009) и Kaler, Watkins, and Angotti (2015) . И в продължение на повече от сроден проект в Южна Африка, вижте Angotti and Sennott (2015) . За повече примери за научни изследвания, използвайки данни от Проекта за Малави Journals виж Kaler (2004) и Angotti et al. (2014) .

Проектиране свой собствен (раздел 5.5)

Моят подход към предлагането дизайн съвети е индуктивен, въз основа на примери за успешни и не успя проекти масови сътрудничество, което съм чувал за. Налице е също така един поток от научни изследвания се опитва да прилага по-общи социални психологически теории за проектиране на онлайн общности, която е свързана с проектирането на проекти за масово сътрудничество, виж, например, Kraut et al. (2012) .

Относно мотивиращи участниците, тя всъщност е доста трудно да разбера точно защо хората да участват в проекти маса за сътрудничество (Nov, Arazy, and Anderson 2011; Cooper et al. 2010, Raddick et al. (2013) ; Tuite et al. 2011; Preist, Massung, and Coyle 2014) . Ако имате намерение да мотивира участниците с плащането на пазара на труда микро-задача (например, Amazon Mechanical Turk) Kittur et al. (2013) предлага някои съвети.

Относно позволява изненада, за повече примери за неочаквани открития, идващи от проекти Zoouniverse, вижте Marshall, Lintott, and Fletcher (2015) .

По отношение е етично, някои добри общи въведение към разглежданите въпроси са Gilbert (2015) , Salehi et al. (2015) , Schmidt (2013) , Williamson (2016) , Resnik, Elliott, and Miller (2015) , и Zittrain (2008) . За въпроси, конкретно свързани с правни въпроси със служителите тълпата, вижте Felstiner (2011) . O'Connor (2013) разглежда въпроси за етично надзор на изследвания, когато ролята на изследователите и на участниците размазване. За въпроси, свързани с обмен на данни като същевременно се защитава participats в проекти граждански науки, вижте Bowser et al. (2014) . И двете Purdam (2014) и Windt and Humphreys (2016) има някаква дискусия за етичните въпроси в разпределени за събиране на данни. И накрая, най-много проекти признават вноски, но не дават авторство на участниците. В Foldit, играчите на Foldit често са посочени като автор (Cooper et al. 2010; Khatib et al. 2011) . В други проекти открита покана, печелившата принос често може да напише книга, описваща техните решения (например, Bell, Koren, and Volinsky (2010) и Dieleman, Willett, and Dambre (2015) ). В семейството Galaxy Zoo на проекти, изключително активни и важни фактори понякога са поканени да бъдат съавтори на документи. Например, Иван Terentev и Тим Matorny, двама участници Radio Galaxy Zoo от Русия, са съавтори на един от документите, които са възникнали от този проект (Banfield et al. 2016; Galaxy Zoo 2016) .