กิจกรรม

  • ระดับความยากง่าย ง่าย ปานกลาง กลาง หนัก ยาก , ยากมาก ยากมาก
  • ต้องใช้คณิตศาสตร์ ( ต้องใช้คณิตศาสตร์ )
  • ต้องใช้รหัส ( ต้องเข้ารหัส )
  • การเก็บรวบรวมข้อมูล ( การเก็บรวบรวมข้อมูล )
  • สิ่งที่ฉันชอบ ( ของโปรด )
  1. [ ยากมาก , ต้องเข้ารหัส , การเก็บรวบรวมข้อมูล , ของโปรด ] หนึ่งในการเรียกร้องที่น่าตื่นเต้นที่สุดจากการวิจัยของเบอนัวต์และเพื่อนร่วมงาน (2016) เกี่ยวกับการเข้ารหัสข้อมูลทางการเมืองของกลุ่มผู้ชุมนุมคือผลที่ได้สามารถทำซ้ำได้ Merz, Regel, and Lewandowski (2016) ให้สิทธิ์การเข้าถึง Manifesto Corpus ลองทำซ้ำรูปที่ 2 จาก Benoit et al. (2016) โดยใช้แรงงานจาก Amazon Mechanical Turk ผลลัพธ์ของคุณคล้ายแค่ไหน?

  2. [ กลาง ] ในโครงการ InfluenzaNet กลุ่มอาสาสมัครรายงานสถานการณ์อุบัติการณ์ความชุกและการแสวงหาพฤติกรรมที่เกี่ยวข้องกับโรคไข้หวัดใหญ่ (Tilston et al. 2010; Noort et al. 2015)

    1. เปรียบเทียบและเปรียบเทียบการออกแบบค่าใช้จ่ายและข้อผิดพลาดที่อาจเกิดขึ้นใน InfluenzaNet, Google แนวโน้มไข้หวัดใหญ่และระบบติดตามการติดเชื้อไข้หวัดใหญ่แบบดั้งเดิม
    2. พิจารณาเวลาที่ไม่แน่นอนเช่นการระบาดของโรคไข้หวัดใหญ่รูปแบบใหม่ อธิบายข้อผิดพลาดที่เป็นไปได้ในแต่ละระบบ
  3. [ ยาก , ต้องเข้ารหัส , การเก็บรวบรวมข้อมูล ] The Economist เป็นนิตยสารข่าวรายสัปดาห์ สร้างโครงการการคำนวณของมนุษย์เพื่อดูว่าอัตราส่วนของผู้หญิงกับผู้ชายบนหน้าปกมีการเปลี่ยนแปลงตามช่วงเวลา

    1. นิตยสารสามารถครอบคลุมได้หลากหลายในแปดภูมิภาค (แอฟริกาเอเชียแปซิฟิกยุโรปสหภาพยุโรปละตินอเมริกาตะวันออกกลางอเมริกาเหนือและสหราชอาณาจักร) และสามารถดาวน์โหลดได้จากเว็บไซต์ของนิตยสาร เลือกหนึ่งในภูมิภาคเหล่านี้และทำการวิเคราะห์ อย่าลืมบรรยายถึงขั้นตอนของคุณด้วยรายละเอียดเพียงพอที่จะทำให้ผู้อื่นสามารถเลียนแบบได้

    คำถามนี้ได้รับแรงบันดาลใจจากโครงการที่คล้ายกันโดย Justin Tenuto นักวิทยาศาสตร์ด้านข้อมูลของ CrowdsFlower ที่ crowdsourcing บริษัท : ดู "นิตยสารไทม์ชอบคนดีมาก" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ ยากมาก , ต้องเข้ารหัส , การเก็บรวบรวมข้อมูล ] จากคำถามก่อนหน้านี้ตอนนี้ทำการวิเคราะห์ทั้ง 8 ภูมิภาค

    1. คุณพบความแตกต่างอะไรในแต่ละภูมิภาค
    2. คุณใช้เวลาและเงินเท่าไรในการขยายการวิเคราะห์ของคุณไปยังภูมิภาคทั้ง 8 แห่ง?
    3. ลองนึกภาพว่า นักเศรษฐศาสตร์ มีปกที่แตกต่างกัน 100 ครั้งในแต่ละสัปดาห์ คาดว่าจะมีเวลาและเงินเพิ่มเท่าใดเพื่อขยายการวิเคราะห์ของคุณเป็น 100 ครั้งต่อสัปดาห์
  5. [ ยาก , ต้องเข้ารหัส ] มีเว็บไซต์หลายแห่งที่เป็นเจ้าภาพโครงการโทรเปิดเช่น Kaggle มีส่วนร่วมในโครงการเหล่านี้และอธิบายถึงสิ่งที่คุณได้เรียนรู้เกี่ยวกับโครงการนั้นและเกี่ยวกับการโทรแบบเปิดโดยทั่วไป

  6. [ กลาง ] ดูฉบับล่าสุดของวารสารในสาขาของคุณ มีเอกสารใดบ้างที่สามารถถูกจัดรูปแบบเป็นโครงการแบบเปิดใหม่ได้หรือไม่? ทำไมหรือทำไมไม่?

  7. [ ง่าย ] Purdam (2014) อธิบายถึงข้อมูลการแจกจ่ายข้อมูลเกี่ยวกับการขอทานในกรุงลอนดอน สรุปจุดแข็งและจุดอ่อนของการออกแบบการวิจัยนี้

  8. [ กลาง ] ความซ้ำซ้อนเป็นวิธีสำคัญในการประเมินคุณภาพของการกระจายข้อมูล Windt and Humphreys (2016) พัฒนาและทดสอบระบบเพื่อรวบรวมรายงานเหตุการณ์ความขัดแย้งจากประชาชนในคองโกตะวันออก อ่านกระดาษ

    1. การออกแบบของพวกเขาทำให้เกิดความซ้ำซ้อนได้อย่างไร?
    2. พวกเขาเสนอวิธีการต่างๆเพื่อตรวจสอบข้อมูลที่เก็บรวบรวมจากโครงการของพวกเขา สรุปพวกเขา อะไรที่น่าเชื่อมากที่สุดสำหรับคุณ
    3. เสนอวิธีใหม่ที่จะสามารถตรวจสอบข้อมูลได้ ข้อเสนอแนะควรพยายามเพิ่มความมั่นใจว่าคุณจะมีข้อมูลในแบบที่มีประสิทธิภาพและมีจริยธรรม
  9. [ กลาง Karim Lakhani และเพื่อนร่วมงาน (2013) สร้างการเรียกร้องแบบเปิดเพื่อขอรับอัลกอริทึมใหม่เพื่อแก้ปัญหาในด้านชีววิทยาด้านคอมพิวเตอร์ พวกเขาได้รับมากกว่า 600 ส่งที่มี 89 วิธีการคำนวณใหม่ การส่งผลงานเกินกว่าประสิทธิภาพของ MegaBLAST ของสถาบันสุขภาพแห่งชาติสหรัฐอเมริกาและการส่งที่ดีที่สุดได้รับความแม่นยำและความเร็วสูงกว่า (เร็วกว่า 1,000 เท่า)

    1. อ่านบทความของพวกเขาจากนั้นเสนอปัญหาการวิจัยทางสังคมที่สามารถใช้การประกวดแบบเดียวกันนี้ได้ โดยเฉพาะการประกวดแบบเปิดนี้เน้นการเร่งและปรับปรุงประสิทธิภาพของอัลกอริทึมที่มีอยู่ ถ้าคุณไม่สามารถคิดถึงปัญหาเช่นนี้ในสาขาของคุณได้ลองอธิบายว่าทำไมไม่
  10. [ กลาง , ของโปรด ] โครงการคำนวณของมนุษย์จำนวนมากพึ่งพาผู้เข้าร่วมจาก Amazon Mechanical Turk ลงชื่อสมัครใช้เพื่อเป็นพนักงานใน Amazon Mechanical Turk ใช้เวลาหนึ่งชั่วโมงในการทำงานที่นั่น สิ่งเหล่านี้ส่งผลต่อความคิดของคุณเกี่ยวกับการออกแบบคุณภาพและจริยธรรมของโครงการการคำนวณของมนุษย์อย่างไร?