थप टिप्पणी

यो अनुवाद एक कम्प्यूटर द्वारा सिर्जना गरिएको थियो। ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

थप टिप्पणी

यो खण्ड एक कथा रूपमा पढ्नुपर्छ भन्दा, एउटा सन्दर्भ रूपमा प्रयोग गर्न डिजाइन गरिएको छ।

(परिचय खण्ड 5.1)

मास सहकार्य नागरिक विज्ञान, क्राउडसोर्सिङ, र सामूहिक बुद्धि देखि विचार Blends। नागरिक विज्ञान सामान्यतया "नागरिक" (अर्थात्, गैर-वैज्ञानिकहरूले) वैज्ञानिक प्रक्रियामा सामेल भएको अर्थ (Crain, Cooper, and Dickinson 2014) । क्राउडसोर्सिङ सामान्यतया भीडलाई यो आउटसोर्सिंग संगठन भित्र सामान्यतया हल समस्या लिएर र सट्टा अर्थ (Howe 2009) । सामूहिक बुद्धि सामान्यतया जस्तो कि बौद्धिक तरिकामा सामूहिक अभिनय व्यक्तिहरूको समूह अर्थ (Malone and Bernstein 2015) । Nielsen (2012) वैज्ञानिक अनुसन्धान लागि ठूलो सहयोग को शक्ति मा एक अद्भुत पुस्तक-लम्बाइ परिचय छ।

त्यहाँ ठूलो सहयोग को धेरै प्रकार म प्रस्तावित कि तीन कोटिमा सफासँग फिट छैन भनेर हो, र म तिनीहरू केही बिन्दुमा सामाजिक अनुसन्धान उपयोगी हुन सक्छ किनभने तीन विशेष ध्यान दिनुपर्छ लाग्छ। एउटा उदाहरण जहाँ सहभागीहरू किन्न भविष्यवाणी बजार, र त्यो संसारमा उत्पन्न परिणाम मा उद्धारयोग्य आधारित छन् भन्ने व्यापार अनुबंध छ (Wolfers and Zitzewitz 2004; Arrow et al. 2008) । भविष्यवाणी बजार अक्सर पूर्वानुमान लागि कम्पनीहरु र सरकारको द्वारा प्रयोग गरिन्छ र भविष्यवाणी बजार पनि मनोविज्ञान मा प्रकाशित अध्ययन को replicability भविष्यवाणी गर्न सामाजिक अनुसन्धानकर्ताहरूले प्रयोग गरिएको छ (Dreber et al. 2015)

मेरो वर्गीकरण योजना मा राम्रो तरिकाले फिट गर्दैन दोस्रो उदाहरण अनुसन्धानकर्ताहरूले नयाँ गणित प्रमेयों प्रमाणित गर्न ब्लग र विकिहरु प्रयोग collaborated जहाँ PolyMath परियोजना, छ (Gowers and Nielsen 2009; Cranshaw and Kittur 2011; Nielsen 2012; Kloumann et al. 2016) । यो PolyMath परियोजना Netflix पुरस्कार समान केही तरिका छ, तर सहभागीहरू PolyMath परियोजनामा थप सक्रिय अरूको आंशिक समाधान मा बनाए।

मेरो वर्गीकरण योजना मा राम्रो तरिकाले फिट गर्दैन तेस्रो उदाहरण समय-निर्भर जस्तै रक्षा विकसित रिसर्च प्रोजेक्ट्स एजेन्सी (DARPA) नेटवर्क चुनौती (अर्थात्, लाल बेलुन चुनौती) को रूपमा mobilizations छ। यी समय थप लागि संवेदनशील mobilizations हेर्न Pickard et al. (2011) , Tang et al. (2011) , र Rutherford et al. (2013) ।

मानव गणना (धारा 5.2)

शब्द "मानव गणना" कम्प्युटर वैज्ञानिकहरूले गरेको काम को बाहिर आउछ, र यो अनुसन्धान पछि सन्दर्भ यो उत्तरदायी हुन सक्छ समस्या बाहिर छनोट गर्न आफ्नो क्षमता सुधार हुनेछ समझ। केही कार्यका लागि, कम्प्युटर अविश्वसनीय क्षमताहरु सम्म पनि विशेषज्ञ मानिसहरूलाई अधिक संग शक्तिशाली छन्। उदाहरणका लागि, चेस मा, कम्प्युटर पनि सबै भन्दा राम्रो महान् मालिकको जित्न सक्नुहुन्छ। तर-र यो कम राम्रो सामाजिक द्वारा सराहना वैज्ञानिकहरूले-अन्य कार्यहरू, कम्प्युटर वास्तवमा मान्छे भन्दा धेरै बुरा छन्। अर्को शब्दमा, अहिले तपाईं चित्र, भिडियो, अडियो, र पाठ प्रकृया मुछिएको केही कार्यहरू मा पनि सबैभन्दा परिष्कृत कम्प्यूटर भन्दा राम्रो हो। त्यसैले-रूपमा एक अद्भुत XKCD द्वारा सचित्र थियो कार्टून-मानिसहरूलाई कम्प्युटर लागि सजिलो र गाह्रो हो कि कार्यहरू छन्, तर त्यहाँ कार्यहरू कम्प्युटर लागि कठिन र मान्छे को लागि सजिलो हो कि (चित्रा 5.13) पनि हो। कम्प्यूटर वैज्ञानिकहरू यी मेहनत-कम्प्युटर--सजिलो को लागि-मानव लागि कार्य, यसकारण तिनीहरूले गणना प्रक्रिया मानिसहरूलाई समावेश गर्न सक्छ भनेर बुझे काम गरिरहेका छन्। यहाँ कसरी लुइस वन Ahn छ (2005) मानव गणना वर्णन उहाँले पहिलो आफ्नो प्रबंध मा शब्द गढा गर्दा: "। उपयोग कम्प्युटर अझै समाधान गर्न सक्दैन भनेर समस्या समाधान गर्न मानव संसाधन शक्ति लागि एक प्रतिमान"

मानव विशेषज्ञहरु को क्षमता अधिक केही कार्यहरू कम्प्युटर अचम्मको हो,: आंकडा 5.13। तर, अन्य कार्यका लागि, साधारण मानिसहरूलाई पनि परिष्कृत कम्प्युटर प्रणाली outperform गर्न सक्नुहुन्छ। कम्प्युटर लागि कठिन र मानिसहरूले सजिलो हो कि कार्यहरू संलग्न ठूलो मात्रा समस्या मानव गणना लागि राम्रो उपयुक्त छन्। यहाँ वर्णन सर्तहरू अनुसार प्रयोग: http://xkcd.com/license.html

यो परिभाषा FoldIt-जो म खुला मा खण्डमा वर्णन गरेर कल-सकिएन मानव गणना परियोजना छलफल। किनभने यो विशेष सीप आवश्यक तथापि, म खुला कल रूपमा FoldIt कोटिबद्ध गर्न छनौट र यो भन्दा राम्रो समाधान एक विभाजित-लागू-संयोजन रणनीति प्रयोग गरेर भन्दा योगदान लाग्छ।

मानव गणना को एक उत्कृष्ट पुस्तक लम्बाइ उपचार लागि, अवधि सबैभन्दा सामान्य अर्थमा, हेर्न Law and Ahn (2011) । अध्याय 3 Law and Ahn (2011) यस अध्यायमा हुनेहरूको भन्दा बढी जटिल संयोजन कदम को एक रोचक चर्चा छ।

शब्द "विभाजन-लागू-संयोजन" द्वारा प्रयोग भएको थियो Wickham (2011) तथ्याङ्क गणनाको लागि एक रणनीति वर्णन गर्न, तर यो पूर्ण मानव गणना परियोजनाहरूको प्रक्रिया कब्जा। यो विभाजन-लागू-संयोजन रणनीति Google मा विकास भएको MapReduce रूपरेखा मिल्दोजुल्दो छ (Dean and Ghemawat 2004; Dean and Ghemawat 2008) ।

दुई चतुर मानव गणना म छलफल गर्न ठाउँ छैन भनेर परियोजनाहरू पनि ESP खेल हो (Ahn and Dabbish 2004) र reCAPTCHA (Ahn et al. 2008) । यी परियोजनाहरूको दुवै तस्बिरहरू मा लेबल प्रदान गर्न सहभागीहरू उत्प्रेरित गर्न रचनात्मक तरिका फेला परेन। तर, यी परियोजनाहरूको दुवै, ग्यालेक्सी चिडियाघर विपरीत, ESP खेल र reCAPTCHA सहभागी आफ्नो डाटा प्रयोग भइरहेको कसरी थाहा थिएन पनि नैतिक प्रश्नहरू खडा (Lung 2012; Zittrain 2008) ।

को ESP खेल प्रेरित भएर, धेरै अनुसन्धानकर्ताहरूले अरूलाई "एक उद्देश्य खेल" विकास गर्ने प्रयास गरेका छन् (Ahn and Dabbish 2008) (अर्थात्, "मानव-आधारित गणना खेल" (Pe-Than, Goh, and Lee 2015) ) हुन सक्छ अन्य समस्या को एक किसिम समाधान गर्न प्रयोग। के यी "एक उद्देश्य खेल" सामान्य छ तिनीहरूले मानव गणना रमाइलो संलग्न कार्य गर्न प्रयास गर्ने छ। तसर्थ, ESP खेल नै विभाजित-लागू-संयोजन ग्यालेक्सी चिडियाघर संग संरचना साझेदारी गर्दा, यो सहभागीहरू कसरी उत्प्रेरित-मजा विज्ञान मदत गर्न इच्छा बिरुद्ध मा अलग छ।

ग्यालेक्सी चिडियाघर मेरो विवरण मा ड्र Nielsen (2012) , Adams (2012) , Clery (2011) , र Hand (2010) , र ग्यालेक्सी चिडियाघर को अनुसन्धान लक्ष्य मेरो प्रस्तुति सरलीकृत थियो। खगोल विज्ञान मा ग्यालेक्सी वर्गीकरण को इतिहास र कसरी ग्यालेक्सी चिडियाघर यो परम्परा जारी थप को लागि, Masters (2012) र Marshall, Lintott, and Fletcher (2015) । ग्यालेक्सी चिडियाघर मा भवन, शोधकर्ताओं ग्यालेक्सी चिडियाघर 2 स्वयंसेवकहरु बाट लाख 60 भन्दा बढी जटिल morphological वर्गीकरण संकलित जो पूरा (Masters et al. 2011) । यसबाहेक, तिनीहरूले, चन्द्र को सतह अन्वेषण ग्रह को लागि खोज, र पुरानो कागजातहरू transcribing सहित ग्यालेक्सी आकृति को बाहिर समस्या बाहिर branched। हाल, आफ्नो सबै परियोजनाहरू मा संकलित छन् www.zooniverse.org (Cox et al. 2015) । को को एक परियोजनाहरू-फोटो ग्यालेक्सी चिडियाघर-प्रकार छवि वर्गीकरण परियोजनाहरू पनि पर्यावरणीय अनुसन्धान को लागि गर्न सकिन्छ भन्ने प्रमाण Serengeti-प्रदान गर्दछ (Swanson et al. 2016) ।

अनुसन्धानकर्ताहरूले मानव गणना परियोजनाका लागि माइक्रो-कार्य श्रम बजार (जस्तै, अमेजन यांत्रिक टर्क) प्रयोग गर्न योजना लागि, Chandler, Paolacci, and Mueller (2013) र Wang, Ipeirotis, and Provost (2015) कार्य डिजाइन र राम्रो सल्लाह प्रस्ताव अन्य सम्बन्धित मुद्दाहरू।

म दोस्रो पुस्ता मानव गणना प्रणाली भनिन्छ गर्नुभएको के सिर्जना रुचि अनुसन्धानकर्ताहरूले (जस्तै, एक मिसिन सिक्ने मोडेल तालिम मानव लेबल प्रयोग प्रणाली) मा रुचि हुन सक्छ Shamir et al. (2014) र (अडियो प्रयोग गरेर एउटा उदाहरण को लागि) Cheng and Bernstein (2015) । साथै, यी परियोजनाहरू जसद्वारा अनुसन्धानकर्ताहरूले सबैभन्दा ठूलो भविष्यवाणी प्रदर्शन मेसिन शिक्षा मोडेल सिर्जना गर्न प्रतिस्पर्धा खुला कल, संग गर्न सकिन्छ। उदाहरणका लागि, ग्यालेक्सी चिडियाघर टोली खुला कल भाग्यो र विकास एक outperformed एक नयाँ दृष्टिकोण फेला Banerji et al. (2010) ; हेर्न Dieleman, Willett, and Dambre (2015) विवरण लागि।

कल खुला (धारा 5.3)

कल खुला नयाँ छैन। वास्तवमा, सबै भन्दा चिरपरिचित खुला कल को एक फिर्ता 1714 मिति गर्दा ब्रिटेन गरेको संसद समुद्रमा जहाज को देशान्तर निर्धारण गर्न एक तरिका हुन सक्छ कि कुनै लागि देशान्तर पुरस्कार सिर्जना गरियो। समस्या न्यूटन सहित दिन, सबैभन्दा ठूलो वैज्ञानिकहरूको धेरै stumped र विजेता समाधान अन्ततः तरिका खगोल विज्ञान समावेश भनेर एक समाधान केन्द्रित थिए वैज्ञानिकहरूले देखि अलग समस्या नजिक जो देहात देखि एक clockmaker द्वारा प्रस्तुत गरिएको थियो (Sobel 1996) । यो उदाहरण देखाउँछ रूपमा, खुला कल त राम्रो काम गर्न लाग्यो छन् कि एउटा कारण अलग-अलग दृष्टिकोण र कौशल मानिसहरूलाई पहुँच प्रदान छ (Boudreau and Lakhani 2013) । हेर्नुहोस् Hong and Page (2004) र Page (2008) समस्या समाधान मा विविधता को मूल्य मा थप।

अध्याय मा खुला कल अवस्थामा प्रत्येक यो श्रेणी मा पर्छ किन लागि थप व्याख्या को एक बिट आवश्यक छ। पहिलो, म मानव गणना र खुला कल परियोजनाहरू बीच भेद एउटा तरिका उत्पादन सबै समाधान को एक औसत (मानव गणना) वा सबै भन्दा राम्रो समाधान (खुला कल) छ कि छैन भनेर हो। सबै भन्दा राम्रो समाधान व्यक्तिगत समाधान को एक परिष्कृत औसत हुन बाहिर गरिएका कारण Netflix पुरस्कार केहि यस सन्दर्भमा मुश्किल छ, एक एक टुकडी समाधान भनिन्छ नजिक (Bell, Koren, and Volinsky 2010; Feuerverger, He, and Khatri 2012) । Netflix को दृष्टिकोणबाट तथापि, तिनीहरूले के गर्ने थिए सबै भन्दा राम्रो समाधान छनोट भएको थियो।

दोस्रो, मानव गणना केही परिभाषा द्वारा (जस्तै, Von Ahn (2005) ), FoldIt मानव गणना परियोजना विचार गर्नुपर्छ। किनभने यो विशेष सीप आवश्यक तथापि, म खुला कल रूपमा FoldIt कोटिबद्ध गर्न छनौट र यो भन्दा राम्रो समाधान बरु एक विभाजित-लागू-संयोजन रणनीति प्रयोग गरेर भन्दा, योगदान लाग्छ।

अन्तमा, एक कि साथीहरूको-को एकाधिकार वितरण डाटा संग्रह को एउटा उदाहरण हो तर्क सक्छ। म यसलाई एक प्रतियोगिता-जस्तो संरचना छ र केवल सबै भन्दा राम्रो योगदान प्रयोग गरिन्छ (वितरण डाटा संग्रह संग, असल र खराब योगदान को विचार कम स्पष्ट छ जबकि) किनभने खुला कल रूपमा समावेश गर्न चयन गर्नुहोस्।

को Netflix पुरस्कार थप को लागि, Bennett and Lanning (2007) , Thompson (2008) , Bell, Koren, and Volinsky (2010) , र Feuerverger, He, and Khatri (2012) । FoldIt थप हेर्नुहोस्, Cooper et al. (2010) , Andersen et al. (2012) , र Khatib et al. (2011) ; FoldIt मेरो विवरण वर्णन मा ड्र Nielsen (2012) , Bohannon (2009) , र Hand (2010) । साथीहरूको-को एकाधिकार थप को लागि, Noveck (2006) , Bestor and Hamp (2010) , Ledford (2007) , र Noveck (2009) ।

को परिणाम समान Glaeser et al. (2016) , Mayer-Schönberger and Cukier (2013) , न्यूयोर्क शहर मा आवास निरीक्षक को उत्पादकत्व मा अध्याय 10 रिपोर्टहरू ठूलो लाभ जब निरीक्षण भविष्यवाणी मोडेल द्वारा निर्देशित छन्। न्यूयोर्क शहर, यी भविष्यवाणी मोडेल शहर कर्मचारीहरु द्वारा निर्मित थिए, तर अन्य अवस्थामा, एक ती सृष्टि गर्न सक्छ वा खुला कल संग सुधार कल्पना सक्छ (जस्तै, Glaeser et al. (2016) )। तर, भविष्यवाणी मोडेल स्रोतहरू आवंटित गर्न प्रयोग भइरहेको एक प्रमुख चासो मोडेलहरू अवस्थित पक्षपात सुदृढ गर्न सम्भावित छ भन्ने छ। धेरै अनुसन्धानकर्ताहरूले पहिले नै "मा फोहोर बाहिर, फोहोर" थाहा छ, र भविष्यवाणी मोडेल यो हुन सक्छ "मा पूर्वाग्रह, पूर्वाग्रह बाहिर।" हेर्नुहोस् Barocas and Selbst (2016) र O'Neil (2016) निर्माण भविष्यवाणी मोडेल को खतराबाट मा थप biased प्रशिक्षण डाटा संग।

खुला प्रतियोगिताहरूमा प्रयोग सरकारको रोक्न सक्छन् भनेर एउटा समस्या यो डाटा जारी, गोपनीयता उल्लङ्घन गर्न लगाउन सक्छ जो आवश्यक छ। खुला कल मा गोपनीयता र डाटा जारी बारेमा थप देख्न Narayanan, Huey, and Felten (2016) र अध्याय 6 मा छलफल।

वितरण डाटा संग्रह (धारा 5.4)

EBird मेरो विवरण वर्णन मा ड्र Bhattacharjee (2005) र Robbins (2013) । कसरी अनुसन्धानकर्ताहरूले eBird डाटा विश्लेषण गर्न तथ्याङ्क मोडेल प्रयोग थप हेर्नुहोस् Hurlbert and Liang (2012) र Fink et al. (2010) । Ornothology मा नागरिक विज्ञान को इतिहास मा थप हेर्नुहोस् Greenwood (2007) ।

को मलावी जरनल परियोजना मा थप हेर्नुहोस् Watkins and Swidler (2009) र Kaler, Watkins, and Angotti (2015) । र दक्षिण अफ्रिका मा एक सम्बन्धित परियोजना मा थप हेर्नुहोस् Angotti and Sennott (2015) । को मलावी जरनल परियोजना डेटा अनुसन्धान प्रयोग बढी उदाहरणको लागि हेर्न Kaler (2004) र Angotti et al. (2014) ।

आफ्नै (धारा 5.5) डिजाइन

डिजाइन सल्लाह भेटी मेरो दृष्टिकोण सफल उदाहरण आधारित आगमनात्मक थियो र म सुनेका छौं कि ठूलो सहयोग परियोजनाहरू असफल भयो। अनुसन्धान को धारा थप सामान्य सामाजिक मनोवैज्ञानिक सिद्धान्त अनलाइन समुदाय डिजाइन उदाहरणका लागि,,, ठूलो सहयोग परियोजनाहरूको डिजाइन गर्न उपयुक्त हुन्छ भनेर लागू हेर्न प्रयास पनि छ Kraut et al. (2012) ।

उत्प्रेरणा सहभागीहरू सन्दर्भमा, यो ठीक किन मान्छे ठूलो सहयोग परियोजनामा भाग बाहिर आंकडा वास्तवमा एकदम मुश्किल छ (Nov, Arazy, and Anderson 2011; Cooper et al. 2010, Raddick et al. (2013) ; Tuite et al. 2011; Preist, Massung, and Coyle 2014) । तपाईं एक माइक्रो-कार्य श्रम बजार मा भुक्तानी (जस्तै, अमेजन यांत्रिक टर्क) संग सहभागीहरू उत्प्रेरित गर्ने योजना भने Kittur et al. (2013) केही सल्लाह प्रदान गर्दछ।

Zoouniverse परियोजनाहरूको बाहिर आ अनपेक्षित आविष्कारहरू बढी उदाहरण को लागि, आश्चर्य सक्षम सन्दर्भमा हेर्न Marshall, Lintott, and Fletcher (2015) ।

नैतिक हुनुको सन्दर्भमा संलग्न विवादहरू केही राम्रो सामान्य भूमिका हो Gilbert (2015) , Salehi et al. (2015) , Schmidt (2013) , Williamson (2016) , Resnik, Elliott, and Miller (2015) , र Zittrain (2008) । मुद्दाहरू विशेष भीड कर्मचारीहरु संग कानुनी मुद्दाहरू सम्बन्धित लागि, हेर्न Felstiner (2011) । O'Connor (2013) अनुसन्धान को नैतिक निरीक्षण बारेमा प्रश्नहरू सम्बोधन अनुसन्धानकर्ताहरूले र सहभागीहरू को भूमिका अस्पष्ट छ। नागरिक विज्ञान परियोजनामा participats सुरक्षा गर्दा साझेदारी डाटा सम्बन्धित मुद्दाहरू लागि, हेर्न Bowser et al. (2014) । दुवै Purdam (2014) र Windt and Humphreys (2016) वितरण डाटा संग्रह मा नैतिक मुद्दाहरू बारेमा केही चर्चा छ। अन्तमा, सबैभन्दा परियोजनाहरू योगदान स्वीकार तर सहभागीहरूलाई ग्रन्थकारिता क्रेडिट दिन छैन। Foldit मा, Foldit खेलाडीहरू अक्सर एक लेखक रूपमा सूचीबद्ध (Cooper et al. 2010; Khatib et al. 2011) अन्य खुला कल परियोजनाहरू मा, विजेता योगदानकर्ता अक्सर आफ्नो समाधान व्याख्या गर्ने कागज लेख्न सक्नुहुन्छ (जस्तै, Bell, Koren, and Volinsky (2010) र Dieleman, Willett, and Dambre (2015) )। परियोजनाहरू को ग्यालेक्सी चिडियाघर परिवार मा, अत्यन्तै सक्रिय र महत्वपूर्ण योगदान कहिलेकाहीं हुन कागजात मा सह-लेखक आमन्त्रित गरिन्छ। उदाहरणका लागि, इवान Terentev र टिम Matorny, रूस देखि दुई रेडियो ग्यालेक्सी चिडियाघर सहभागीहरू, परियोजना बाट उठ्दा कि कागजात को एक मा सह-लेखक थिए (Banfield et al. 2016; Galaxy Zoo 2016) ।