dejavnosti

Legenda:

  • stopnja težavnosti: lahka enostavno , srednje srednje , trda težko , zelo težko zelo težko
  • zahteva matematike ( zahteva matematike )
  • zahteva kodiranje ( zahteva kodiranje )
  • Zbiranje podatkov ( Zbiranje podatkov )
  1. [ zelo težko , zahteva kodiranje , Zbiranje podatkov ] Ena izmed najbolj zanimivih zahtevkov od Benoit et al. (2015) na množice kodiranja političnih manifestov je, da so rezultati ponovljivi. Merz, Regel, and Lewandowski (2016) omogoča dostop do manifest korpusa. Poskusite reproducirati sliko 2 iz Benoit et al. (2015) s pomočjo delavcev iz Amazon Mechanical Turk. Kako podobni so bili rezultati?

  2. [ srednje ] V projektu InfluenzaNet prostovoljec plošča ljudi, poroča pojavnosti, razširjenosti in vedenje išče zdravje, povezano z gripi podobna bolezen (GPB) (Tilston et al. 2010; Noort et al. 2015) .

    1. Primerjati in projektiranje, stroški, in verjetne napake v InfluenzaNet, Google Flu Trends in tradicionalne sisteme sledenja gripe.
    2. Razmislite nemirno časa, kot je prašičja izbruha gripe. Opišite morebitne napake v vsakem sistemu.
  3. [ težko , zahteva kodiranje , Zbiranje podatkov ] The Economist je tednik novice. Ustvariti človeško projekt računanja, da vidim, če je razmerje žensk z moškimi na naslovnici sčasoma povečal.

    1. Revija ima lahko različne pokrove v osmih različnih regijah (Afrika, Azija Pacifik, Evropa, Evropska unija, Latinska Amerika, Bližnji vzhod, Severna Amerika in Združeno kraljestvo) in jih lahko vse prenesete s spletne strani The Economist . Izberite eno od teh regij in izvedbo analize. Bodite prepričani, da opiše svoje postopke z dovolj podrobno, da bi se lahko ponovili nekdo drug.

    To vprašanje je navdihnila podoben projekt Justin Tenuto, znanstvenika podatkov v bing podjetju CrowdFlower , glejte "Time Magazine zares všeč fantje" .

  4. [ zelo težko , zahteva kodiranje , Zbiranje podatkov ] Na podlagi zgornje vprašanje, zdaj izvesti analizo vseh osem regij.

    1. Kakšne so razlike si našel med regijami?
    2. Koliko več časa in denarja, je trajalo, da obsega-up svojo analizo do vseh osem regij?
    3. Predstavljajte si, da je Economist 100 različnih pokrovov vsak teden. Oceniti, koliko dodatnega časa in denarja bi bilo potrebno, da obsega-up svojo analizo na 100 pokrovov na teden.
  5. [ težko , zahteva kodiranje ] [Kaggle] (https://www.kaggle.com/) je spletna stran, ki gosti odprtih projektov klicev. Sodelujte v enem od teh projektov.

  6. [ srednje ] Pogled skozi nedavni izdaji revije na svojem področju. Ali obstajajo dokumenti, ki bi jih lahko oblikovano kot projekti javnega razpisa? Zakaj ali zakaj ne?

  7. [ enostavno ] Purdam (2014) opisal porazdeljeno zbirko podatkov o beračenju v Londonu. Povzeti prednosti in slabosti tega raziskovalnega načrta.

  8. [ srednje ] Redundanca je pomemben način za oceno kakovosti porazdeljene zbiranja podatkov. Windt and Humphreys (2016) Razvoj in testiranje sistema za zbiranje poročil o konfliktnih dogodkov od ljudi v vzhodnem Kongu. Preberite papir.

    1. Kako njihova zasnova zagotovitev redundance?
    2. Nudijo več pristopov za preverjanje podatkov, zbranih iz njihovega projekta. Povzemajo jih. Ki je bil najbolj prepričljiv na vas?
    3. Predlagajte nov način, da se lahko podatki potrdil. Predlogi morajo potruditi, da bi povečali zaupanje, da bi si morali v podatke na način, ki je stroškovno učinkovito in etično.
  9. [ srednje ] Karim Lakhani in sodelavci (2013) ustvaril javni razpis zahtevati nove algoritme za reševanje problema v računski biologije. So prejeli več kot 600 vlog, ki vsebujejo 89 novih računalniških pristopov. Glede na predloge, ki jih je prejela 30, ki presega zmogljivosti ZDA National Institutes of Megablast Health, in najboljši predložitev doseči tako večjo natančnost in hitrost (1.000-krat hitreje).

    1. Preberite svoj papir, nato pa predlaga problem socialne raziskave, ki bi lahko uporabljali isto vrsto odprtega natečaja. Še posebej je ta vrsta odprtega natečaja osredotočila na pospešitev in izboljšanje delovanja obstoječega algoritma. Če ne morem razmišljati o problemu, kot je ta na svojem področju, poskušal razložiti, zakaj ne.
  10. [ srednje ] Veliko računanja projekti človekovih zanašajo na udeležence iz Amazon Mechanical Turk. Sign-up, da postane delavec na Amazon Mechanical Turk. Preživite eno uro tam delajo. Kako to vpliva svoje misli o oblikovanju, kakovosti in etika projektov s področja človekovih compuation?