Bit By Bit: Social Research in the Digital Age
  • เกี่ยวกับ
    • เปิดรีวิว
    • การอ้างอิง
    • รหัส
    • เกี่ยวกับผู้เขียน
    • ความเป็นส่วนตัวและความยินยอม
  • ภาษา
    • English
    • Afrikaans
    • Albanian
    • Amharic
    • Arabic
    • Armenian
    • Azerbaijani
    • Basque
    • Belarusian
    • Bengali
    • Bosnian
    • Bulgarian
    • Catalan
    • Cebuano
    • Chichewa
    • Chinese Simplified
    • Chinese Traditional
    • Corsican
    • Croatian
    • Czech
    • Danish
    • Dutch
    • Esperanto
    • Estonian
    • Filipino
    • Finnish
    • French
    • Frisian
    • Galician
    • Georgian
    • German
    • Greek
    • Gujarati
    • Haitian Creole
    • Hausa
    • Hawaiian
    • Hebrew
    • Hindi
    • Hmong
    • Hungarian
    • Icelandic
    • Igbo
    • Indonesian
    • Irish
    • Italian
    • Japanese
    • Javanese
    • Kannada
    • Kazakh
    • Khmer
    • Korean
    • Kurdish (Kurmanji)
    • Kyrgyz
    • Lao
    • Latin
    • Latvian
    • Lithuanian
    • Luxembourgish
    • Macedonian
    • Malagasy
    • Malay
    • Malayalam
    • Maltese
    • Maori
    • Marathi
    • Mongolian
    • Myanmar (Burmese)
    • Nepali
    • Norwegian
    • Pashto
    • Persian
    • Polish
    • Portuguese
    • Punjabi
    • Romanian
    • Russian
    • Samoan
    • Scots Gaelic
    • Serbian
    • Sesotho
    • Shona
    • Sindhi
    • Sinhala
    • Slovak
    • Slovenian
    • Somali
    • Spanish
    • Sudanese
    • Swahili
    • Swedish
    • Tajik
    • Tamil
    • Telugu
    • Thai
    • Turkish
    • Ukrainian
    • Urdu
    • Uzbek
    • Vietnamese
    • Welsh
    • Xhosa
    • Yiddish
    • Yoruba
    • Zulu
  • Teaching
  • Media
  • Read Online
  • ซื้อหนังสือ
    • Princeton University Press
    • Amazon
    • Barnes and Noble
    • IndieBound
  • คำนำ
  • 1 บทนำ
    • 1.1 เปื้อนหมึก
    • 1.2 ยินดีต้อนรับสู่ยุคดิจิตอล
    • 1.3 การออกแบบการวิจัย
    • 1.4 รูปแบบของหนังสือเล่มนี้
    • 1.5 โครงร่างของหนังสือเล่มนี้
    • สิ่งที่ต้องอ่านต่อไป
  • 2 พฤติกรรมการสังเกต
    • 2.1 บทนำ
    • 2.2 ข้อมูลขนาดใหญ่
    • 2.3 ลักษณะทั่วไป 10 ข้อของข้อมูลขนาดใหญ่
      • 2.3.1 ใหญ่
      • 2.3.2 Always-on
      • 2.3.3 Nonreactive
      • 2.3.4 ไม่สมบูรณ์
      • 2.3.5 ไม่สามารถเข้าถึงได้
      • 2.3.6 Nonrepresentative
      • 2.3.7 ดริฟท์
      • 2.3.8
      • 2.3.9 สกปรก
      • 2.3.10 Sensitive
    • 2.4 ยุทธศาสตร์การวิจัย
      • 2.4.1 สิ่งที่นับ
      • 2.4.2 การพยากรณ์และ nowcasting
      • 2.4.3 การทดลองใกล้เคียง
    • 2.5 สรุป
    • บันทึกทางคณิตศาสตร์
    • สิ่งที่ต้องอ่านต่อไป
    • กิจกรรม
  • 3 คำถามถาม
    • 3.1 บทนำ
    • 3.2 ถามและสังเกต
    • 3.3 กรอบข้อผิดพลาดแบบสำรวจทั้งหมด
      • 3.3.1 การเป็นตัวแทน
      • 3.3.2 การวัด
      • 3.3.3 ค่าใช้จ่าย
    • 3.4 จะถามใคร
    • 3.5 วิธีการใหม่ของการถามคำถาม
      • 3.5.1 การประเมินผลเชิงนิเวศน์ชั่วขณะ
      • 3.5.2 การสำรวจวิกิพีเดีย
      • 3.5.3 Gamification
    • 3.6 แบบสำรวจที่เชื่อมโยงกับแหล่งข้อมูลขนาดใหญ่
      • 3.6.1 ให้กับ
      • 3.6.2 ขอขยาย
    • 3.7 สรุป
    • บันทึกทางคณิตศาสตร์
    • สิ่งที่ต้องอ่านต่อไป
    • กิจกรรม
  • 4 การทดลองวิ่ง
    • 4.1 บทนำ
    • 4.2 อะไรคือการทดลอง?
    • 4.3 สองมิติของการทดลอง: ห้องปฏิบัติการภาคสนามและอนาล็อกดิจิตอล
    • 4.4 ย้ายที่อยู่นอกเหนือการทดลองง่ายๆ
      • 4.4.1 ตั้งแต่วันที่
      • 4.4.2 เซลล์สืบพันธุ์ของผลการรักษา
      • 4.4.3 กลไก
    • 4.5 การทำให้เกิดขึ้น
      • 4.5.1 ใช้สภาพแวดล้อมที่มีอยู่
      • 4.5.2 สร้างการทดสอบของคุณเอง
      • 4.5.3 สร้างผลิตภัณฑ์ของคุณเอง
      • 4.5.4 พันธมิตรกับผู้มีอำนาจ
    • 4.6 แนะนำ
      • 4.6.1 สร้างศูนย์ข้อมูลต้นทุนผันแปร
      • 4.6.2 สร้างจริยธรรมในการออกแบบของคุณ: แทนที่, ปรับแต่งและลด
    • 4.7 สรุป
    • บันทึกทางคณิตศาสตร์
    • สิ่งที่ต้องอ่านต่อไป
    • กิจกรรม
  • 5 การสร้างความร่วมมือมวล
    • 5.1 บทนำ
    • 5.2 การคำนวณของมนุษย์
      • 5.2.1 สวนสัตว์กาแล็กซี่
      • 5.2.2 ฝูงชนการเข้ารหัสของแถลงการณ์ทางการเมือง
      • 5.2.3 สรุป
    • 5.3 เปิดสาย
      • 5.3.1 Netflix รางวัล
      • 5.3.2 Foldit
      • 5.3.3 Peer-to-สิทธิบัตร
      • 5.3.4 สรุป
    • 5.4 การเก็บรวบรวมข้อมูลแบบกระจาย
      • 5.4.1 eBird
      • 5.4.2 PhotoCity
      • 5.4.3 สรุป
    • 5.5 การออกแบบของคุณเอง
      • 5.5.1 ผู้เข้าร่วมกระตุ้น
      • 5.5.2 ความหลากหลาย Leverage
      • 5.5.3 เน้นความสนใจ
      • 5.5.4 การเปิดใช้งานความประหลาดใจ
      • 5.5.5 มีจริยธรรม
      • 5.5.6 คำแนะนำในการออกแบบขั้นสุดท้าย
    • 5.6 สรุป
    • สิ่งที่ต้องอ่านต่อไป
    • กิจกรรม
  • 6 จริยธรรม
    • 6.1 บทนำ
    • 6.2 ตัวอย่างที่สาม
      • 6.2.1 Contagion อารมณ์
      • 6.2.2 รสนิยมความสัมพันธ์และเวลา
      • 6.2.3 Encore
    • 6.3 ดิจิตอลเป็นที่แตกต่างกัน
    • 6.4 หลักการสี่
      • 6.4.1 เคารพบุคคล
      • 6.4.2 เกื้อกูล
      • 6.4.3 ความยุติธรรม
      • 6.4.4 เคารพกฎหมายและความสนใจจากประชาชน
    • 6.5 สองกรอบจริยธรรม
    • 6.6 พื้นที่ของความยากลำบาก
      • 6.6.1 ความยินยอม
      • 6.6.2 การทำความเข้าใจและการจัดการความเสี่ยงในการให้ข้อมูล
      • 6.6.3 ความเป็นส่วนตัว
      • 6.6.4 การตัดสินใจทำในการเผชิญกับความไม่แน่นอน
    • 6.7 เคล็ดลับการปฏิบัติ
      • 6.7.1 คณะกรรมการเป็นชั้นไม่เพดาน
      • 6.7.2 ใส่ตัวเองในรองเท้าของคนอื่น
      • 6.7.3 คิดของจริยธรรมการวิจัยอย่างต่อเนื่องไม่ได้โดยสิ้นเชิง
    • 6.8 สรุป
    • ภาคผนวกที่สำคัญทางประวัติศาสตร์
    • สิ่งที่ต้องอ่านต่อไป
    • กิจกรรม
  • 7 อนาคต
    • 7.1 รอคอย
    • 7.2 ธีมของอนาคต
      • 7.2.1 การผสมผสานของผลิตภัณฑ์สำเร็จรูปและของที่ระลึก
      • 7.2.2 การเก็บรวบรวมข้อมูลผู้เข้าร่วมเป็นศูนย์กลาง
      • 7.2.3 จริยธรรมในการออกแบบการวิจัย
    • 7.3 กลับไปที่จุดเริ่มต้น
  • กิตติกรรมประกาศ
  • อ้างอิง
แปลนี้ถูกสร้างขึ้นโดยคอมพิวเตอร์ ×

สิ่งที่ต้องอ่านต่อไป

  • บทนำ (หัวข้อ 5.1)

การทำงานร่วมกันของมวลรวมความคิดจาก วิทยาศาสตร์พลเมือง crowdsourcing และ สติปัญญา ร่วมกัน พลเมืองวิทยาศาสตร์มักหมายถึง "พลเมือง" (กล่าวคือนักวิทยาศาสตร์) ในกระบวนการทางวิทยาศาสตร์; สำหรับข้อมูลเพิ่มเติมโปรดดูที่ Crain, Cooper, and Dickinson (2014) และ Bonney et al. (2014) Crowdsourcing มักหมายถึงการแก้ปัญหาตามปกติภายในองค์กรและแทนที่จะจ้างให้ฝูงชน; ดูเพิ่มเติม Howe (2009) กลุ่มข่าวกรองมักหมายถึงกลุ่มบุคคลที่แสดงร่วมกันในลักษณะที่ดูฉลาด สำหรับข้อมูลเพิ่มเติมดู Malone and Bernstein (2015) Nielsen (2012) เป็นบทนำสู่หนังสือเล่มหนึ่งเกี่ยวกับพลังแห่งการทำงานร่วมกันของมวลเพื่อการวิจัยทางวิทยาศาสตร์

มีหลายประเภทของการทำงานร่วมกันของมวลชนที่ไม่พอดีอย่างเรียบร้อยในสามประเภทที่ฉันได้เสนอและฉันคิดว่าสามเหล่านี้สมควรได้รับความสนใจเป็นพิเศษเพราะพวกเขาอาจมีประโยชน์ในการวิจัยทางสังคม ตัวอย่างหนึ่งคือตลาดทำนายที่ผู้เข้าร่วมซื้อและทำสัญญาการค้าที่สามารถแลกได้โดยอาศัยผลที่เกิดขึ้นในโลก ตลาดคาดการณ์มักถูกใช้โดย บริษัท และรัฐบาลในการคาดการณ์และพวกเขายังถูกใช้โดยนักวิจัยทางสังคมเพื่อทำนายการจำลองแบบของการศึกษาที่เผยแพร่ในด้านจิตวิทยา (Dreber et al. 2015) สำหรับภาพรวมของตลาดการคาดคะเนให้ดูที่ Wolfers and Zitzewitz (2004) และ Arrow et al. (2008)

ตัวอย่างที่สองที่ไม่เหมาะสมในโครงร่างของฉันคือโครงการ PolyMath ซึ่งนักวิจัยได้ร่วมกันใช้บล็อกและวิกิเพื่อพิสูจน์ทฤษฎีบททางคณิตศาสตร์ใหม่ ๆ โครงการ PolyMath มีลักษณะคล้ายกับ Netflix Prize แต่ในโครงการนี้ผู้เข้าร่วมโครงการได้มีส่วนร่วมในการแก้ปัญหาบางส่วนของผู้อื่น สำหรับข้อมูลเพิ่มเติมเกี่ยวกับโครงการ PolyMath ดูเรื่อง Gowers and Nielsen (2009) , Cranshaw and Kittur (2011) , Nielsen (2012) และ Kloumann et al. (2016)

ตัวอย่างที่สามที่ไม่เหมาะสมกับโครงร่างการจัดหมวดหมู่ของฉันคือการระดมกำลังตามเวลาเช่นโครงการความท้าทายของโครงข่ายงานวิจัยขั้นสูงของ Defense Advanced (DARPA) (เช่นความท้าทายของบอลลูนแดง) สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการระดมทุนที่เกี่ยวกับเวลาเหล่านี้โปรดดู Pickard et al. (2011) , Tang et al. (2011) และ Rutherford et al. (2013)

  • การคำนวณของมนุษย์ (ตอนที่ 5.2)

คำว่า "การคำนวณของมนุษย์" ออกมาจากงานที่ทำโดยนักวิทยาศาสตร์คอมพิวเตอร์และการทำความเข้าใจบริบทเบื้องหลังการวิจัยนี้จะช่วยเพิ่มความสามารถในการหาปัญหาที่อาจเหมาะสมกับเนื้อหาดังกล่าว สำหรับบางงานเครื่องคอมพิวเตอร์มีพลังที่เหนือชั้นและมีขีดความสามารถที่เหนือกว่ามนุษย์ผู้เชี่ยวชาญ ยกตัวอย่างเช่นในหมากรุกคอมพิวเตอร์สามารถเอาชนะแกรนด์มาสเตอร์ที่ดีที่สุดได้ แต่ - และนี่เป็นสิ่งที่นักวิทยาศาสตร์ทางสังคมชื่นชอบ - สำหรับงานอื่น ๆ คอมพิวเตอร์ส่วนใหญ่แย่กว่าคนทั่วไป กล่าวคือในตอนนี้คุณดีกว่าแม้แต่คอมพิวเตอร์ที่ซับซ้อนที่สุดในงานบางอย่างที่เกี่ยวกับการประมวลผลภาพวิดีโอเสียงและข้อความ นักวิทยาศาสตร์คอมพิวเตอร์ที่ทำงานเกี่ยวกับงานที่ยากต่อการใช้งานคอมพิวเตอร์เหล่านี้จึงเป็นที่เข้าใจว่าพวกเขาสามารถรวมมนุษย์ไว้ในกระบวนการคำนวณได้ นี่เป็นวิธีที่ Luis von Ahn (2005) อธิบายถึงการคำนวณของมนุษย์เมื่อเขาได้ตั้งชื่อวิทยานิพนธ์ไว้ในวิทยานิพนธ์ของเขา: "กระบวนทัศน์ในการใช้พลังประมวลผลของมนุษย์ในการแก้ปัญหาที่คอมพิวเตอร์ยังไม่สามารถแก้ได้" สำหรับการประมวลผลของมนุษย์ในหนังสือ ความหมายทั่วไปของคำนี้ให้ดูที่ Law and Ahn (2011)

ตามคำจำกัดความที่เสนอใน Ahn (2005) Foldit - ซึ่งผมได้อธิบายไว้ในส่วนเกี่ยวกับการเรียกแบบเปิด - อาจถือได้ว่าเป็นโครงการการคำนวณของมนุษย์ อย่างไรก็ตามฉันเลือกที่จะจัดประเภท Foldit เป็นแบบเปิดเนื่องจากต้องใช้ทักษะเฉพาะ (แม้ว่าจะไม่ใช่การฝึกอบรมที่เป็นทางการ) และจะใช้วิธีแก้ปัญหาที่ดีกว่าแทนที่จะใช้กลยุทธ์ split-apply-combine

คำว่า "split-apply-combine" ถูกใช้โดย Wickham (2011) เพื่ออธิบายถึงกลยุทธ์สำหรับการคำนวณทางสถิติ แต่ก็สามารถจับภาพกระบวนการของโครงการคำนวณของมนุษย์ได้อย่างสมบูรณ์ กลยุทธ์ split-apply-combine คล้ายกับกรอบ MapReduce ที่พัฒนาขึ้นที่ Google สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ MapReduce ดู Dean and Ghemawat (2004) และ Dean and Ghemawat (2008) สำหรับข้อมูลเพิ่มเติมเกี่ยวกับสถาปัตยกรรมคอมพิวเตอร์แบบกระจายอื่น ๆ โปรดดู Vo and Silvia (2016) บทที่ 3 ของ Law and Ahn (2011) ได้กล่าวถึงโครงการที่มีขั้นตอนการผสมผสานที่ซับซ้อนกว่าที่กล่าวมาในบทนี้

ในโครงการการคำนวณของมนุษย์ที่ฉันได้กล่าวถึงในบทผู้เข้าอบรมตระหนักถึงสิ่งที่เกิดขึ้น อย่างไรก็ตามบางโครงการอื่น ๆ พยายามที่จะจับภาพ "งาน" ที่เกิดขึ้น (คล้ายกับ eBird) และไม่มีการรับรู้ของผู้เข้าร่วม ดูตัวอย่างเช่นเกม ESP (Ahn and Dabbish 2004) และ reCAPTCHA (Ahn et al. 2008) อย่างไรก็ตามโครงการทั้งสองโครงการนี้ยังก่อให้เกิดคำถามเชิงจริยธรรมเนื่องจากผู้เข้าร่วมไม่ทราบว่าข้อมูลของพวกเขาถูกนำมาใช้อย่างไร (Zittrain 2008; Lung 2012)

ได้รับแรงบันดาลใจจาก ESP Game นักวิจัยหลายคนพยายามที่จะพัฒนา "เกมที่มีจุดมุ่งหมาย" (Ahn and Dabbish 2008) ("เกมคำนวณจากมนุษย์" (Pe-Than, Goh, and Lee 2015) ) ที่สามารถทำได้ ใช้เพื่อแก้ปัญหาต่างๆ สิ่งเหล่านี้ "เกมที่มีจุดประสงค์" มีเหมือนกันคือพวกเขาพยายามทำให้งานที่เกี่ยวข้องในการคำนวณของมนุษย์สนุก ดังนั้นในขณะที่เกม ESP แชร์โครงสร้าง split-apply-combine เดียวกันกับ Galaxy Zoo มันแตกต่างกันอย่างไรในการที่ผู้เข้าร่วมมีแรงบันดาลใจในการเล่นและความปรารถนาที่จะช่วยวิทยาศาสตร์ สำหรับข้อมูลเพิ่มเติมเกี่ยวกับเกมที่มีวัตถุประสงค์ให้ดู Ahn and Dabbish (2008)

คำอธิบายของฉันเกี่ยวกับ Galaxy Zoo ขึ้นอยู่กับ Nielsen (2012) , Adams (2012) , Clery (2011) และ Hand (2010) และการนำเสนอเป้าหมายการวิจัยของ Galaxy Zoo ได้ง่ายขึ้น สำหรับข้อมูลเพิ่มเติมเกี่ยวกับประวัติของการจำแนกดาราจักรในดาราศาสตร์และวิธีการที่ Galaxy Zoo ดำเนินต่อไปนี้ให้ดู Masters (2012) และ Marshall, Lintott, and Fletcher (2015) นักวิจัยได้สร้าง Galaxy Zoo 2 ซึ่งรวบรวมการจัดจำแนกทางสัณฐานวิทยาที่ซับซ้อนกว่า 60 ล้านชุดจากอาสาสมัคร (Masters et al. 2011) นอกจากนี้พวกเขายังแยกออกเป็นปัญหาด้านนอกคำอธิบายภาพของกาแลคซีรวมถึงการสำรวจพื้นผิวดวงจันทร์ค้นหาดาวเคราะห์และถ่ายทอดข้อความเก่า ปัจจุบันโครงการทั้งหมดของพวกเขารวบรวมไว้ที่เว็บไซต์ของ Zooniverse (Cox et al. 2015) หนึ่งในโครงการ Snapshot Serengeti แสดงให้เห็นว่าโครงการจำแนกประเภทของ Galaxy Zoo-type สามารถทำได้สำหรับการวิจัยด้านสิ่งแวดล้อม (Swanson et al. 2016)

สำหรับนักวิจัยที่วางแผนจะใช้ตลาดแรงงานขนาดเล็ก (เช่น Amazon Mechanical Turk) สำหรับโครงการคำนวณของมนุษย์ Chandler, Paolacci, and Mueller (2013) และ J. Wang, Ipeirotis, and Provost (2015) ให้คำแนะนำที่ดีเกี่ยวกับการออกแบบงานและ ประเด็นที่เกี่ยวข้องอื่น ๆ Porter, Verdery, and Gaddis (2016) นำเสนอตัวอย่างและคำแนะนำที่มุ่งเน้นเฉพาะเกี่ยวกับการใช้ตลาดแรงงานขนาดเล็กสำหรับสิ่งที่พวกเขาเรียกว่า "การเสริมข้อมูล" เส้นแบ่งระหว่างการเพิ่มข้อมูลและการรวบรวมข้อมูลค่อนข้างเบลอ สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการรวบรวมและใช้ป้ายกำกับสำหรับการเรียนรู้ที่มีการกำกับดูแลสำหรับข้อความโปรดดูที่ Grimmer and Stewart (2013)

นักวิจัยที่สนใจในการสร้างสิ่งที่ฉันเรียกว่าระบบการคำนวณของมนุษย์ (เช่นระบบที่ใช้ฉลากของมนุษย์ในการฝึกแบบจำลองการเรียนรู้ด้วยเครื่อง) อาจมีความสนใจใน Shamir et al. (2014) (ตัวอย่างเช่นการใช้เสียง) และ Cheng and Bernstein (2015) นอกจากนี้โมเดลการเรียนรู้ของเครื่องในโครงการเหล่านี้สามารถเรียกร้องได้ด้วยการเรียกแบบเปิดซึ่งนักวิจัยพยายามแข่งขันเพื่อสร้างโมเดลการเรียนรู้ด้วยเครื่องที่มีประสิทธิภาพในการคาดการณ์ที่ยิ่งใหญ่ที่สุด ตัวอย่างเช่นทีมงาน Galaxy Zoo ได้เปิดการประชุมแบบเปิดกว้างและพบวิธีการใหม่ ๆ ที่มีประสิทธิภาพสูงกว่า Banerji et al. (2010) ; ดู Dieleman, Willett, and Dambre (2015) สำหรับรายละเอียด

  • สายที่เปิดอยู่ (ส่วน 5.3)

สายที่เปิดไม่ใช่เรื่องใหม่ อันที่จริงแล้วการโทรแบบเปิดกว้างที่มีชื่อเสียงที่สุดแห่งหนึ่งเกิดขึ้นในปีค. ศ. 1714 เมื่อรัฐสภาของสหราชอาณาจักรได้สร้าง Longitude Prize สำหรับทุกคนที่สามารถพัฒนาวิธีกำหนดเส้นลองจิจูดของเรือในทะเลได้ ปัญหาที่ทำให้นักวิทยาศาสตร์ที่ยิ่งใหญ่หลายสมัยหลายต่อหลายคนรวมทั้งไอแซคนิวตันและวิธีการแก้ปัญหาที่ชนะได้ถูกส่งโดยจอห์นแฮร์ริสันผู้ผลิตนาฬิกาจากชนบทที่เข้าหาปัญหานี้แตกต่างจากนักวิทยาศาสตร์ที่มุ่งเน้นการแก้ปัญหาที่เกี่ยวข้องกับดาราศาสตร์ ; สำหรับข้อมูลเพิ่มเติมดู Sobel (1996) ตัวอย่างเช่นนี้แสดงให้เห็นว่าสาเหตุหนึ่งที่ทำให้การโทรแบบเปิดเป็นไปได้ดีว่าพวกเขาให้การเข้าถึงคนที่มีมุมมองและทักษะที่แตกต่างกัน (Boudreau and Lakhani 2013) ดู Hong and Page (2004) และ Page (2008) เพื่อหาค่าความหลากหลายในการแก้ปัญหา

แต่ละกรณีที่เปิดการโทรในบทต้องใช้คำอธิบายเพิ่มเติมเล็กน้อยว่าเพราะเหตุใดจึงอยู่ในหมวดหมู่นี้ ประการแรกทางเดียวที่ฉันแยกความแตกต่างระหว่างการคำนวณของมนุษย์กับโครงการสายเรียกเข้าคือว่าผลลัพธ์เป็นค่าเฉลี่ยของโซลูชันทั้งหมดหรือไม่หรือการแก้ปัญหาที่ดีที่สุด (การเรียกแบบเปิด) รางวัล Netflix เป็นเรื่องที่ยุ่งยากมากในเรื่องนี้เนื่องจากทางออกที่ดีที่สุดกลายเป็นโซลูชันเฉพาะของแต่ละบุคคลซึ่งเป็นแนวทางที่เรียกว่าโซลูชันรวม (Bell, Koren, and Volinsky 2010; Feuerverger, He, and Khatri 2012) จากมุมมองของ Netflix สิ่งที่พวกเขาต้องทำก็คือเลือกวิธีที่ดีที่สุด สำหรับข้อมูลเพิ่มเติมเกี่ยวกับรางวัล Netflix ให้ดูที่ Bennett and Lanning (2007) , Thompson (2008) , Bell, Koren, and Volinsky (2010) และ Feuerverger, He, and Khatri (2012)

ประการที่สองโดยคำนิยามของการคำนวณของมนุษย์ (เช่น Ahn (2005) ), Foldit ควรได้รับการพิจารณาเป็นโครงการคำนวณของมนุษย์ อย่างไรก็ตามฉันเลือกที่จะจัดหมวดหมู่เป็นแบบเปิดเนื่องจากต้องใช้ทักษะเฉพาะ (แม้ว่าจะไม่จำเป็นต้องมีการฝึกอบรมเฉพาะ) และก็จะเป็นทางออกที่ดีที่สุดแทนที่จะใช้กลยุทธ์ split-apply-combine สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ Foldit โปรดดูที่ Cooper et al. (2010) Khatib et al. (2011) และ Andersen et al. (2012) ; คำอธิบายของฉันเกี่ยวกับ Foldit ใช้คำอธิบายใน Bohannon (2009) , Hand (2010) และ Nielsen (2012)

สุดท้ายเราสามารถโต้แย้งว่า Peer-to-Patent เป็นตัวอย่างของการแจกจ่ายข้อมูลแบบกระจาย ฉันเลือกที่จะรวมเป็นแบบเปิดเนื่องจากมีโครงสร้างเหมือนการประกวดและมีเพียงส่วนร่วมที่ดีที่สุดเท่านั้นขณะที่มีการแจกจ่ายข้อมูลแบบกระจายความคิดเกี่ยวกับการมีส่วนร่วมที่ดีและไม่ดีก็ไม่มีความชัดเจน สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ Peer-to-Patent โปรดดูที่ Noveck (2006) , Ledford (2007) , Noveck (2009) และ Bestor and Hamp (2010)

ในแง่ของการใช้โทรศัพท์แบบเปิดในงานวิจัยทางสังคมผลที่ได้จะคล้ายคลึงกับผลงานของ Glaeser et al. (2016) ได้รับการรายงานในบทที่ 10 ของ Mayer-Schönberger and Cukier (2013) ด้วยเหตุนี้นิวยอร์กซิตี้จึงสามารถใช้โมเดลเชิงพยากรณ์เพื่อสร้างผลกำไรมหาศาลในการตรวจสอบที่อยู่อาศัย ในนิวยอร์กซิตี้โมเดลพยากรณ์เหล่านี้สร้างขึ้นโดยพนักงานในเมือง แต่ในกรณีอื่น ๆ เราสามารถจินตนาการได้ว่าสามารถสร้างหรือปรับปรุงได้ด้วยการโทรแบบเปิด (เช่น Glaeser et al. (2016) ) อย่างไรก็ตามความกังวลหลักเกี่ยวกับรูปแบบการคาดการณ์ที่ใช้ในการจัดสรรทรัพยากรคือรูปแบบเหล่านี้มีศักยภาพในการเสริมสร้างอคติที่มีอยู่ นักวิจัยหลายคนทราบว่า "ขยะมูลฝอยขยะ" และด้วยรูปแบบการทำนายสามารถ "อคติและอคติได้" ดู Barocas and Selbst (2016) และ O'Neil (2016) สำหรับข้อมูลเพิ่มเติมเกี่ยวกับอันตรายของรูปแบบการคาดการณ์ ข้อมูลการฝึกอบรมลำเอียง

ปัญหาหนึ่งที่อาจขัดขวางไม่ให้รัฐบาลใช้การแข่งขันที่เปิดอยู่คือเรื่องนี้ต้องมีการเผยแพร่ข้อมูลซึ่งอาจนำไปสู่การละเมิดข้อมูลส่วนบุคคล สำหรับข้อมูลเพิ่มเติมเกี่ยวกับความเป็นส่วนตัวและการเปิดเผยข้อมูลในการโทรแบบเปิดให้ดู Narayanan, Huey, and Felten (2016) และการอภิปรายในบทที่ 6

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับความแตกต่างและความคล้ายคลึงกันระหว่างคำทำนายและคำอธิบายโปรดดู Breiman (2001) , Shmueli (2010) , Watts (2014) และ Kleinberg et al. (2015) สำหรับข้อมูลเพิ่มเติมเกี่ยวกับบทบาทของการทำนายในการวิจัยทางสังคมให้ดู Athey (2017) , Cederman and Weidmann (2017) , Hofman, Sharma, and Watts (2017) , ( ??? ) และ Yarkoni and Westfall (2017)

สำหรับการทบทวนโครงการสายด่วนทางชีววิทยารวมทั้งคำแนะนำด้านการออกแบบดู Saez-Rodriguez et al. (2016)

  • การแจกจ่ายข้อมูล (ส่วนที่ 5.4)

คำอธิบายของฉันเกี่ยวกับคำอธิบายของ eBird ใน Bhattacharjee (2005) , Robbins (2013) และ Sullivan et al. (2014) สำหรับข้อมูลเพิ่มเติมเกี่ยวกับวิธีที่นักวิจัยใช้โมเดลทางสถิติในการวิเคราะห์ข้อมูล eBird ดูที่ Fink et al. (2010) และ Hurlbert and Liang (2012) สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการประเมินความสามารถของผู้เข้าร่วม eBird ดู Kelling, Johnston, et al. (2015) สำหรับข้อมูลเพิ่มเติมเกี่ยวกับประวัติความเป็นมาของวิทยาศาสตร์พลเมืองในวิทยาวิทยาให้ดูที่ Greenwood (2007)

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับโครงการ Malawi Journals Project โปรดดู Watkins and Swidler (2009) และ Kaler, Watkins, and Angotti (2015) สำหรับข้อมูลเพิ่มเติมเกี่ยวกับโครงการที่เกี่ยวข้องในแอฟริกาใต้ดู Angotti and Sennott (2015) สำหรับตัวอย่างเพิ่มเติมของการวิจัยโดยใช้ข้อมูลจากโครงการวารสารมาลาวีดู Kaler (2004) และ Angotti et al. (2014)

  • การออกแบบของคุณเอง (ส่วน 5.5)

แนวทางของฉันในการให้คำแนะนำในการออกแบบเป็นแบบอุปนัยโดยอิงจากตัวอย่างโครงการความร่วมมือที่ประสบความสำเร็จและล้มเหลวของมวลชนที่ฉันเคยได้ยิน นอกจากนี้ยังมีกระแสความพยายามในการวิจัยเพื่อใช้ทฤษฎีทางจิตวิทยาสังคมทั่วไปในการออกแบบชุมชนออนไลน์ที่เกี่ยวข้องกับการออกแบบโครงการความร่วมมือร่วมกันดูตัวอย่างเช่น Kraut et al. (2012)

เกี่ยวกับการสร้างแรงจูงใจให้กับผู้เข้าอบรมเป็นเรื่องยากที่จะอธิบายว่าเหตุใดผู้คนจึงมีส่วนร่วมในโครงการความร่วมมือร่วมกัน (Cooper et al. 2010; Nov, Arazy, and Anderson 2011; Tuite et al. 2011; Raddick et al. 2013; Preist, Massung, and Coyle 2014) หากคุณวางแผนที่จะกระตุ้นให้ผู้เข้าร่วมการชำระเงินในตลาดแรงงานขนาดเล็ก (เช่น Amazon Mechanical Turk), Kittur et al. (2013) มีคำแนะนำบางประการ

เกี่ยวกับการสร้างความประหลาดใจให้กับตัวอย่างของการค้นพบที่ไม่คาดฝันออกมาจากโครงการของ Zooiverse ให้ดูที่ Marshall, Lintott, and Fletcher (2015)

เกี่ยวกับการมีจริยธรรมการแนะนำโดยทั่วไปเกี่ยวกับประเด็นที่เกี่ยวข้อง ได้แก่ Gilbert (2015) Salehi et al. (2015) , Schmidt (2013) , Williamson (2016) , Resnik, Elliott, and Miller (2015) และ Zittrain (2008) สำหรับประเด็นที่เกี่ยวข้องกับประเด็นทางกฎหมายเกี่ยวกับพนักงานฝูงชนให้ดู Felstiner (2011) O'Connor (2013) ตั้งคำถามเกี่ยวกับการกำกับดูแลด้านจริยธรรมของการวิจัยเมื่อบทบาทนักวิจัยและผู้เข้าร่วมเบลอ สำหรับประเด็นที่เกี่ยวข้องกับการแบ่งปันข้อมูลในขณะที่ปกป้องผู้เข้าร่วมโครงการวิทยาศาสตร์พลเมืองให้ดูที่ Bowser et al. (2014) ทั้ง Purdam (2014) และ Windt and Humphreys (2016) ได้มีการอภิปรายเกี่ยวกับประเด็นด้านจริยธรรมในการจัดเก็บข้อมูลแบบกระจาย ในที่สุดโครงการส่วนใหญ่ก็รับทราบผลงาน แต่ไม่ให้เครดิตกับผู้มีส่วนร่วม ใน Foldit ผู้เล่นมักจะถูกระบุว่าเป็นผู้แต่ง (Cooper et al. 2010; Khatib et al. 2011) ในโครงการโทรศัพท์แบบเปิดอื่น ๆ ผู้ที่ได้รับรางวัลสามารถเขียนบทความอธิบายถึงโซลูชันของตนได้ (เช่น Bell, Koren, and Volinsky (2010) และ Dieleman, Willett, and Dambre (2015) )

Powered by Open Review Toolkit

Buy The Book

Image of Bit by Bit cover Princeton University Press Amazon Barnes and Noble IndieBound