aktivitetet

Celes:

  • shkalla e vështirësisë: e lehtë i lehtë , të mesme medium , hard i vështirë , shume e veshtire shume e veshtire
  • kërkon matematikë ( kërkon matematikë )
  • kërkon kodim ( kërkon kodim )
  • Mbledhja e të dhënave ( Mbledhja e të dhënave )
  1. [ shume e veshtire , kërkon kodim , Mbledhja e të dhënave ] Një nga pretendimet më emocionuese nga Benoit et al. (2015) në turmë-kodim të manifestet politike është se rezultatet janë të riprodhueshme. Merz, Regel, and Lewandowski (2016) ofron qasje në Manifesto Korpusit. Mundohuni për të riprodhuar Fig 2 nga Benoit et al. (2015) duke përdorur punëtorët nga Amazon Turk Mekanike. Sa e ngjashme kanë qenë rezultatet tuaja?

  2. [ medium ] Në projektin InfluenzaNet një panel vullnetar i njerëzve raportojnë incidenca, prevalenca dhe shëndetësore kërkojnë sjelljen në lidhje me gripit-si-sëmundje (ili) (Tilston et al. 2010; Noort et al. 2015) .

    1. Krahasoni dhe kontrast të projektimit, kosto, dhe gabimet e mundshme në InfluenzaNet, Google gripit Trendet, dhe sistemet tradicionale ndjekja gripit.
    2. Konsideroni një kohë të pazgjidhur, të tilla si shpërthim të gripit të derrit. Përshkruani gabimet e mundshme në çdo sistem.
  3. [ i vështirë , kërkon kodim , Mbledhja e të dhënave ] The Economist është një revistë javore e lajmeve. Krijo një projekt të llogaritjes njerëzore për të parë nëse raporti i femrave me meshkujt në kopertinën është rritur me kalimin e kohës.

    1. Revista mund të ketë mbulon të ndryshme në tetë rajone të ndryshme (Afrikë, Azi Paqësorit, Evropës, Bashkimit Evropian, Amerika Latine, Lindja e Mesme, Amerika e Veriut, dhe Mbretëria e Bashkuar), dhe ata të gjithë mund të shkarkohet nga faqja e internetit e The Economist . Zgjidh një nga këto rajone dhe do të kryejë analizat. Të jetë i sigurt për të përshkruar procedurat tuaja me detaje të mjaftueshme që ata të mund të përsëriten nga dikush tjetër.

    Kjo pyetje u frymëzua nga një projekt të ngjashëm me Justin Tenuto, një shkencëtar të dhënave në kompaninë crowdsourcing CrowdFlower , shih "Time Magazine Really Likes dudes" .

  4. [ shume e veshtire , kërkon kodim , Mbledhja e të dhënave ] Duke u bazuar në pyetjen e mësipërme, tani të kryejnë analizat për të gjitha tetë rajonet.

    1. Çfarë ndryshimesh gjetët nëpër rajone?
    2. Sa kohë shtesë dhe të holla e bëri atë të marrë në shkallë-up analizën tuaj në të gjitha tetë rajonet?
    3. Paramendoni se Economist ka 100 mbulon të ndryshme çdo javë. Vlerësojnë se sa kohë shtesë dhe të holla do të duhet për shkallë-up analizën tuaj për 100 mbulon në javë.
  5. [ i vështirë , kërkon kodim ] [Kaggle] (https://www.kaggle.com/) është një faqe interneti që pret projektet e hapur e thirrjes. Të marrë pjesë në një nga ato projekte.

  6. [ medium ] Shiko përmes një çështje të fundit të një reviste në fushën tuaj. A ka dokumente që mund të ishte riformuluar si projekte thirrje të hapura? Pse ose pse jo?

  7. [ i lehtë ] Purdam (2014) përshkroi një mbledhjen e të dhënave të shpërndara në lidhje me lypjen në Londër. Përmblidhni pikat e forta dhe të dobëta të këtij dizajnit hulumtues.

  8. [ medium ] Tepricë është një mënyrë e rëndësishme për të vlerësuar cilësinë e mbledhjes së të dhënave të shpërndara. Windt and Humphreys (2016) të zhvilluar dhe testuar një sistem për të mbledhur raportet e ngjarjeve të konfliktit nga njerëzit në Kongo lindore. Lexoni gazeta.

    1. Si e bën dizajni i tyre të sigurojë tepricë?
    2. Ata ofrojnë disa metoda për të vërtetuar të dhënat e mbledhura nga projekti i tyre. Përmblidhni ato. E cila ishte më bindëse për ju?
    3. Propozojë një mënyrë të re se të dhënat mund të vërtetuar. Sugjerime duhet të përpiqet për të rritur besimin se ju do të keni në të dhënat në një mënyrë që është me kosto efektive dhe etike.
  9. [ medium ] Karim Lakhani dhe kolegët (2013) krijoi një thirrje të hapur për të bëj thirrje për algoritme të reja për të zgjidhur një problem në biologji kompjuterike. Ata morën më shumë se 600 parashtresa që përmbajnë 89 qasje roman kompjuterike. E parashtresave, ata morën 30 që tejkaluar punën e Instituteve Kombëtare të SHBA të MegaBLAST Shëndetësisë, dhe paraqitja më e mirë arrihet edhe saktësinë më të madhe dhe shpejtësi (1000 herë më shpejt).

    1. Lexoni letër e tyre, dhe pastaj të propozojë një problem hulumtim sociale që mund të përdorin të njëjtin lloj të konkursit të hapur. Në veçanti, ky lloj konkursi të hapur është e përqendruar në përshpejtimin dhe përmirësimin e performancës së një algoritmi ekzistues. Nëse ju nuk mund të mendoj për problemin si kjo në fushën tuaj, përpiqen të shpjegojnë pse jo.
  10. [ medium ] Shumë projekte llogaritjes njeriut mbështeten në pjesëmarrës nga Amazon Turk Mekanike. Sign-up për të bërë një punëtor në Amazon Turk Mekanike. Kalojnë një orë duke punuar atje. Si e bën këtë ndikim mendimet tuaja në lidhje me projektimin, cilësinë, dhe etika e projekteve compuation njerëzore?