Activitati

Cheie:

  • grad de dificultate: ușor uşor , mediu mediu , greu greu , foarte greu foarte greu
  • necesită matematică ( necesită matematică )
  • necesită codificare ( necesită codificare )
  • colectare de date ( colectare de date )
  1. [ foarte greu . necesită codificare . colectare de date ] Una dintre cele mai interesante din revendicările Benoit et al. (2015) privind mulțimea-codare a manifestele politice este faptul că rezultatele sunt reproductibile. Merz, Regel, and Lewandowski (2016) oferă acces la Manifestul Corpus. Încercați să reproducă figura 2 de Benoit et al. (2015) , folosind muncitori de la Amazon Mechanical Turk. Cât de asemănătoare au fost rezultatele?

  2. [ mediu ] În cadrul proiectului InfluenzaNet un grup de voluntari de oameni raportează incidența, prevalența și comportamentul de sănătate care caută legate de gripa-like-boala (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. Compară și proiectarea, costurile și erorile probabile în InfluenzaNet, Google Tendințele gripei, și sistemele tradiționale de urmărire a gripei.
    2. Luați în considerare un timp de nerezolvat, cum ar fi izbucnirea gripei porcine. Descrie posibilele erori în fiecare sistem.
  3. [ greu . necesită codificare . colectare de date ] The Economist este o revistă de știri pe săptămână. Crearea unui proiect de calcul uman pentru a vedea dacă raportul dintre femei la bărbați pe coperta a crescut de-a lungul timpului.

    1. Revista poate avea coperți diferite în opt regiuni diferite (Africa, Asia Pacific, Europa, Uniunea Europeană, America Latină, Orientul Mijlociu, America de Nord și Marea Britanie) și acestea pot fi descărcate de pe site - ul The Economist . Alege una dintre aceste regiuni și de a efectua analiza. Asigurați-vă că pentru a descrie procedurile dumneavoastră cu suficiente detalii pentru ca acestea ar putea fi replicat de către altcineva.

    Această întrebare a fost inspirat de un proiect similar de Justin tenuto, un om de știință de date la compania crowdsourcing CrowdFlower , a se vedea "Time Magazine Îi place cu adevărat Dudes" .

  4. [ foarte greu . necesită codificare . colectare de date ] Bazându-se pe întrebarea de mai sus, acum a efectua analiza pentru toate cele opt regiuni.

    1. Ce diferențe ai găsit în toate regiunile?
    2. Cât de mult timp in plus si bani am luat-o la scara mai mare de analiza la toate cele opt regiuni?
    3. Imaginați-vă că Economist are 100 de coperți diferite în fiecare săptămână. Estima cât de mult timp și bani în plus ar lua la o scara mai mare analiza la 100 de capace pe săptămână.
  5. [ greu . necesită codificare ] [Kaggle] (https://www.kaggle.com/) este un site care găzduiește proiecte de apel deschise. Participa la una dintre aceste proiecte.

  6. [ mediu ] Uită-te printr-un numar recent al unei reviste in domeniul tau. Există documente care ar fi putut fi reformulate ca proiecte de apel deschise? De ce sau de ce nu?

  7. [ uşor ] Purdam (2014) s-a descris o colecție de date distribuite cu privire la cersit in Londra. Rezum punctele forte și punctele slabe ale acestui design de cercetare.

  8. [ mediu ] Redundanța este o modalitate importantă de a evalua calitatea colectării datelor distribuite. Windt and Humphreys (2016) să dezvolte și să testeze un sistem de colectare a rapoartelor de evenimente de conflict de la persoanele din estul Congo. Citește ziarul.

    1. Cum se designul lor asigură redundanța?
    2. Ele oferă mai multe abordări pentru validarea datelor colectate de la proiectul lor. le rezum. Care a fost cel mai convingător pentru tine?
    3. Propune un nou mod ca datele pot fi validate. Sugestii ar trebui să încerce să crească încrederea pe care le-ar avea în datele într-un mod care să fie rentabilă și etică.
  9. [ mediu ] Karim Lakhani si colegii sai (2013) a creat un apel deschis pentru a solicita noi algoritmi pentru a rezolva o problemă în biologie computațională. Ei au primit mai mult de 600 de depuneri care conțin 89 de metode de calcul noi. Dintre observațiile, au primit 30, care a depășit performanța US National Institutes of MegaBLAST Sanatatii, iar cea mai bună prezentare realizată atât o mai mare acuratețe și viteză (de 1.000 de ori mai rapid).

    1. Citește mai lucrarea lor, și apoi să propună o problemă de cercetare socială, care ar putea folosi același tip de concurs deschis. În special, acest tip de concurs deschis este axat pe accelerarea și îmbunătățirea performanței unui algoritm existent. În cazul în care nu vă puteți gândi la probleme ca acest lucru în domeniu, încearcă să explice de ce nu.
  10. [ mediu ] Multe proiecte de calcul umane se bazează pe participanți de la Amazon Mechanical Turk. Sign-up pentru a deveni un muncitor de pe Amazon Mechanical Turk. Petrece o oră de muncă acolo. Ce impact gândurile tale despre design-ul, calitatea si etica proiectelor compuation umane?