djelatnost

  • Stepen teškoće: lako lako , srednja srednje , teško teško , vrlo teško vrlo teško
  • zahteva matematiku ( zahteva matematiku )
  • zahteva kodiranje ( zahteva kodiranje )
  • prikupljanje podataka ( prikupljanje podataka )
  • moji omiljeni ( moj najdraži )
  1. [ vrlo teško , zahteva kodiranje , prikupljanje podataka , moj najdraži ] Jedno od najuzbudljivijih tvrdnji istraživanja Benoita i kolega (2016) o gomilanju kod političkih manifestova jeste to što su rezultati ponovljivi. Merz, Regel, and Lewandowski (2016) omogućavaju pristup Manifesto Corpusu. Pokušajte reprodukovati sliku 2 iz Benoit et al. (2016) koristeći radnike Amazon Mechanical Turk. Koliko su bili slični vaši rezultati?

  2. [ srednje ] U projektu InfluenzaNet volonterski panel ljudi prijavljuje incidenciju, prevalenciju i zdravstveno ponašanje vezano za bolesti slične gripu (Tilston et al. 2010; Noort et al. 2015) .

    1. Upoređivanje i kontrast dizajna, troškova i verovatnih grešaka u InfluenzaNet, Google trendovima gripa i tradicionalnim sistemima praćenja gripa.
    2. Razmislite o neuređenom vremenu, kao što je izbijanje novog oblika gripe. Opišite moguće greške u svakom sistemu.
  3. [ teško , zahteva kodiranje , prikupljanje podataka ] Ekonomist je nedeljnik časopisa. Napravite projekat ljudskog izračunavanja da biste videli da li se odnos žena i muškaraca na naslovnici promenio tokom vremena.

    1. Časopis može imati različite pokrivače u osam različitih regiona (Afrika, Azija Pacifik, Evropa, Evropska unija, Latinska Amerika, Bliski istok, Sjeverna Amerika i Velika Britanija) i svi se mogu preuzeti sa web stranice časopisa. Izaberite jedan od ovih regija i izvršite analizu. Obavezno opišite svoje postupke sa dovoljno detaljima da ih neko drugi može replicirati.

    Ovo pitanje je inspirisalo sličan projekat Justina Tenutaa, naučnika podataka u kompaniji crowdourcing CrowdFlower: pogledajte "Time Magazine Really Likes Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ vrlo teško , zahteva kodiranje , prikupljanje podataka ] Izgradite na prethodnom pitanju, sada izvršite analizu za svih osam regiona.

    1. Koje razlike ste pronašli u regionima?
    2. Koliko dodatnog vremena i novca je potrebno za povećanje vaše analize u svih osam regiona?
    3. Zamislite da Ekonomista ima svake nedelje 100 različitih naslova. Procenite koliko će vam vremena i novca trajati da biste povećali svoju analizu na 100 pokrivača nedeljno.
  5. [ teško , zahteva kodiranje ] Postoji nekoliko web stranica koje hostuju projekte otvorenog poziva, kao što je Kaggle. Učestvujte u jednom od tih projekata i opišite šta ste saznali o tom konkretnom projektu io otvorenim pozivima uopšte.

  6. [ srednje ] Pregledajte nedavno izdanje časopisa u vašem polju. Da li postoje papiri koji su mogli biti preformulisani kao projekti otvorenog poziva? Zašto ili zašto ne?

  7. [ lako ] Purdam (2014) opisuje distribuiranu kolekciju podataka o prosjačenju u Londonu. Rezimirajte snage i slabosti ovog istraživanja.

  8. [ srednje ] Redundantnost je važan način za procjenu kvaliteta prikupljanja distribuiranih podataka. Windt and Humphreys (2016) razvili su i testirali sistem za prikupljanje izveštaja o konfliktnim događajima od ljudi u Istočnom Kongu. Pročitajte papir.

    1. Kako njihov dizajn osigurava redundantnost?
    2. Oni su ponudili nekoliko pristupa za validaciju podataka prikupljenih iz svog projekta. Sumirajte ih. Koja je bila ubedljiva za vas?
    3. Predložite novi način da se podaci mogu validirati. Predlozi treba da pokušaju da povećaju poverenje koje biste imali u podatke na način koji je ekonomičan i etički.
  9. [ srednje ] Karim Lakhani i kolege (2013) su otvorili poziv za traženje novih algoritama za rešavanje problema u računskoj biologiji. Dobili su više od 600 podnesaka koji sadrže 89 novih računskih pristupa. Od podnesaka, 30 su prevazilazile performanse američkog MegaBLAST nacionalnog instituta za zdravlje, a najbolje podnošenje postiglo je veću tačnost i brzinu (1.000 puta brže).

    1. Pročitajte njihov rad, a zatim predložite problem socijalnog istraživanja koji bi mogao koristiti istu vrstu otvorenog takmičenja. Konkretno, ovakav otvoreni konkurs je fokusiran na ubrzavanje i poboljšanje performansi postojećeg algoritma. Ako ne možete da zamislite ovakav problem u vašem polju, pokušajte da objasnite zašto ne.
  10. [ srednje , moj najdraži ] Mnogi projekti iz oblasti ljudskih računara se oslanjaju na učesnike iz Amazon Mechanical Turk. Prijavite se da postanete radnik na Amazon Mechanical Turk. Provedite jedan sat tamo. Kako to utiče na vaše misli o dizajnu, kvalitetu i etici projekata ljudskog računanja?