djelatnost

Ključ:

  • stupanj težine: lako lako , srednji srednji , tvrdi teško , vrlo teško vrlo teško
  • traži matematike ( traži matematike )
  • zahtijeva kodiranje ( zahtijeva kodiranje )
  • prikupljanje podataka ( prikupljanje podataka )
  1. [ vrlo teško , zahtijeva kodiranje , prikupljanje podataka ] Jedan od najuzbudljivijih potraživanja od Benoit et al. (2015) na gužve-kodiranje političkih manifesta je da su rezultati ponovljivi. Merz, Regel, and Lewandowski (2016) omogućuje pristup manifest korpus. Pokušajte reproducirati Slika 2 od Benoit et al. (2015) koristeći radnika iz Amazon Mechanical Turk. Kako slični su rezultati?

  2. [ srednji ] U InfluenzaNet projekta volonter panel ljudi prijaviti incidencija, prevalencija i zdravstveno tražeći ponašanje u vezi s gripi-bolesti (BSG) (Tilston et al. 2010; Noort et al. 2015) .

    1. Usporediti i kontrast dizajn, troškovi, a vjerojatno i pogreške u InfluenzaNet, Google Raširenost gripe i tradicionalne sustave za praćenje gripe.
    2. Razmislite neizmirena vremena, kao što su epidemije svinjske gripe. Opišite eventualne pogreške u svakom sustavu.
  3. [ teško , zahtijeva kodiranje , prikupljanje podataka ] The Economist je tjednik magazin. Stvaranje ljudskog računanja projekt kako bi vidjeli ako je omjer muškaraca i žena je na naslovnici je porastao tijekom vremena.

    1. Časopis može imati različite naslovnice u osam različitih regija (Afrika, Azija Pacifik, Europa, Europska unija, Latinskoj Americi, Bliskom Istoku, Sjevernoj Americi i Velikoj Britaniji) i svi oni mogu se preuzeti s web stranice The Economist . Izaberite jedan od tih regija i obaviti analizu. Budite sigurni da opisati svoje postupke s dovoljno detalja koji bi mogli biti odgovor od nekog drugog.

    Ovo pitanje je inspiriran sličnom projektu Justin Tenuto, znanstvenik podataka na wordpress tvrtke CrowdFlower , vidi "Time Magazine stvarno voli momci" .

  4. [ vrlo teško , zahtijeva kodiranje , prikupljanje podataka ] Nadovezujući se na pitanje gore, sad obaviti analizu svih osam regija.

    1. Što razlika ste pronašli po regijama?
    2. Koliko dodatnog vremena i novca trebalo da se scale-up svoju analizu na svih osam regija?
    3. Zamislite da Ekonomist ima 100 različitih pokriva svaki tjedan. Procijeniti koliko dodatnog vremena i novca potrebno da bi scale-up analizu 100 naslovnicama tjedno.
  5. [ teško , zahtijeva kodiranje ] [Kaggle] (https://www.kaggle.com/) je web stranica koja je domaćin otvorenog poziva projekata. Sudjelovati u jednoj od tih projekata.

  6. [ srednji ] Pogledajte kroz nedavnom broju časopisa u svom području. Ima li kakvih radova koji bi mogao biti izmjenjen na otvoreni poziv projektima? Zašto ili zašto ne?

  7. [ lako ] Purdam (2014) opisali su distribuirani prikupljanje podataka o prosjačenju u Londonu. Sažeti prednosti i slabosti ovog istraživačkog projekta.

  8. [ srednji ] Redundancija je važan način za procjenu kvalitete distribuiranih prikupljanja podataka. Windt and Humphreys (2016) razvoj i testiranje sustava za prikupljanje izvješća o sukobima događajima od ljudi u istočnoj Kongo. Pročitajte papir.

    1. Kako se njihov dizajn osigura prekid radnog odnosa?
    2. Oni nude nekoliko pristupa provjeru podataka prikupljenih od njihovih projekata. Sažeti ih. Koji je bio najuvjerljiviji s vama?
    3. Predložiti novi način na koji se podaci mogu biti potvrđene. Prijedlozi bi trebali pokušati povećati povjerenje da će morati u podacima na način koji je ekonomičan i etički.
  9. [ srednji ] Karim Lakhani i suradnici (2013) stvorio je otvoren poziv da tražiti nove algoritme za rješavanje problema u računalnom biologije. Oni su dobili više od 600 podnesaka koji sadrže ukupno 89 novih računalnih pristupe. Podnesaka, dobili su 30 premašuju izvedbu američkog Nacionalnog instituta za zdravlje je MegaBLAST, a najbolji podnesak postigli oba veću preciznost i brzinu (1000 puta brže).

    1. Pročitaj svoj rad, a zatim predlaže problem društvenih istraživanja koja bi mogla koristiti istu vrstu otvorenog natječaja. Konkretno, ova vrsta otvorenog natječaja je usmjeren na ubrzavanje i poboljšanje performansi postojećeg algoritma. Ako se ne možete sjetiti problema kao što je ovaj u svom području, pokušati objasniti zašto ne.
  10. [ srednji ] Mnogi računanja projekti ljudska osloniti na sudionike iz Amazon Mechanical Turk. Prijavite se da postanete radnik Amazon Mechanical Turk. Provedite jedan sat radi tu. Kako ovo utječe vaše misli o dizajnu, kvaliteti i etika ljudskih compuation projektima?