faaliyetler

anahtar:

  • Zorluk derecesi: kolay kolay orta orta , zor zor , çok zor çok zor
  • (Matematik gerektirir matematik gerektirir )
  • (Kodlama gerektirir kodlama gerektirir )
  • veri koleksiyonu ( veri koleksiyonu )
  1. [ çok zor , kodlama gerektirir , veri koleksiyonu ] En heyecan verici iddialardan biri Benoit et al. (2015) siyasi manifestoları kalabalık kodlama sonuçları tekrarlanabilir olmasıdır. Merz, Regel, and Lewandowski (2016) Manifesto Corpus erişim sağlar. Dan Şekil 2 yeniden oluşturmaya çalışın Benoit et al. (2015) Amazon Mechanical Turk işçi kullanarak. Sonuçlarınız nasıl benzerdi?

  2. [ orta ] InfluenzaNet projede insan gönüllü paneli grip benzeri hastalık (GBH) ile ilgili insidans, prevalans ve sağlık arayan davranışı rapor (Tilston et al. 2010; Noort et al. 2015) .

    1. Karşılaştırın ve tasarım, maliyetleri ve InfluenzaNet, Google Grip Trendleri olası hataları ve geleneksel grip izleme sistemleri kontrast.
    2. Böyle domuz gribi salgını gibi bir huzursuz bir zaman düşünün. Her sistemde olası hataları tanımlar.
  3. [ zor , kodlama gerektirir , veri koleksiyonu ] Economist haftalık haber dergisi. kapaktaki erkeklere kadınların oranı zamanla artmıştır görmek için bir insan hesaplama projesi oluşturun.

    1. Dergi sekiz farklı bölgelerde (Afrika, Asya Pasifik, Avrupa, Avrupa Birliği, Latin Amerika, Orta Doğu, Kuzey Amerika ve Birleşik Krallık) farklı kapak olabilir ve hepsi web sitesinden indirilebilir Economist . Bu bölgelerin birini seçin ve analizi gerçekleştirmek. Onlar bir başkası tarafından çoğaltılması ki yeterli ayrıntı ile prosedürlerini tanımlamak için emin olun.

    Bu soru Justin tenuto, crowdsourcing şirkette veri bilim adamı tarafından benzer bir proje esinlenerek CrowdFlower , bkz "Time Magazine Gerçekten Dudes Beğeni" .

  4. [ çok zor , kodlama gerektirir , veri koleksiyonu ] Yukarıdaki soru üzerine Bina, şimdi sekiz bölge için analizi gerçekleştirmek.

    1. Eğer bölgeler arasında ne gibi farklılıklar buldunuz?
    2. Ne kadar ekstra zaman ve para onu ölçek-up bölgelerin her sekiz analizi almak mı?
    3. Ekonomist 100 farklı kapak her hafta vardır düşünün. o ölçek-up analizinizi haftada 100 kapakları alacağını ne kadar ekstra zaman ve para tahmin edin.
  5. [ zor , kodlama gerektirir ] [Kaggle] (https://www.kaggle.com/) açık çağrı projeleri barındıran bir web sitesidir. Bu projelerin birine katılmak.

  6. [ orta ] Kendi alanında bir derginin son sayısında gözden geçirin. açık çağrı projesi olarak yeniden formüle edilmiş herhangi bir bildiri var mı? Neden veya neden değil?

  7. [ kolay ] Purdam (2014) Londra'da yalvarıyor hakkında dağıtılmış veri toplama nitelendirdi. Bu araştırma tasarımının güçlü ve zayıf yönlerini özetler.

  8. [ orta ] Fazlalık dağıtılmış veri toplama kalitesini değerlendirmek için önemli bir yoldur. Windt and Humphreys (2016) geliştirmek ve Doğu Kongo'da insanlardan çatışma olaylarının raporlarını toplamak için bir sistem test edin. Kağıdı oku.

    1. Nasıl kendi tasarım fazlalık sağlıyor?
    2. Onlar projeden toplanan verileri doğrulamak için çeşitli yaklaşımlar sunuyoruz. Onları özetleyin. Hangi sizin için en ikna edici oldu?
    3. veri valide olabilir yeni bir yol önerin. Öneriler maliyet-etkin ve etik bir şekilde veri olurdu güveni artırmak için çalışmalısınız.
  9. [ orta ] Karim Lakhani ve arkadaşları (2013) hesaplamalı biyoloji bir sorunu çözmek için yeni algoritmalar istemek için açık bir çağrı yarattı. Onlar 89 yeni hesaplama yaklaşımları içeren 600'den fazla gönderimler aldı. gönderimler, onlar Sağlık MegaBLAST ABD Ulusal Sağlık Enstitüleri performansını aştı 30 aldı ve en iyi teslim daha fazla doğruluk ve hız (1,000 kat daha hızlı) hem de elde etti.

    1. onların kağıt okumak ve ardından açık yarışma aynı tür kullanabilirsiniz bir sosyal araştırma problemi öneriyoruz. Özellikle, açık yarışma bu tür hızlandırmak ve mevcut bir algoritmanın performansını geliştirmeye odaklanmıştır. Eğer kendi alanında böyle bir sorun düşünemiyorum, neden anlatmaya çalışacağım.
  10. [ orta ] Birçok insan hesaplama projesi Amazon Mechanical Turk katılımcılarla güveniyor. Sign-up Amazon Mechanical Turk bir işçi olmak. Orada çalışan bir saat harcamak. Nasıl insan compuation projeleri bu etki tasarım, kalite konusunda düşünceler ve etik mi?