aktivitetet

 • shkalla e vështirësisë: e lehtë i lehtë , të mesme medium , e vështirë i vështirë , shume e veshtire shume e veshtire
 • kërkon matematikë ( kërkon matematikë )
 • kërkon kodim ( kërkon kodim )
 • Mbledhja e të dhënave ( Mbledhja e të dhënave )
 • te Preferuarat e mia ( my favorite )
 1. [ shume e veshtire , kërkon kodim , Mbledhja e të dhënave , my favorite ] Një nga pretendimet më emocionuese nga Benoit dhe hulumtimi i kolegëve (2016) mbi kodimin e turmave të manifestimeve politike është se rezultatet janë të riprodhueshme. Merz, Regel, and Lewandowski (2016) sigurojnë akses në Manifesto Corpus. Mundohuni të riprodhoni figurën 2 nga Benoit et al. (2016) duke përdorur punëtorët nga Amazon Mechanical Turk. Sa të ngjashme ishin rezultatet tuaja?

 2. [ medium ] Në projektin InfluenzaNet një panel vullnetarësh njerëzish raportojnë incidencën, prevalencën dhe sjelljen e kërkimit të shëndetit në lidhje me sëmundjen e ngjashme me gripin (Tilston et al. 2010; Noort et al. 2015) .

  1. Krahaso dhe kontrast hartën, kostot dhe gabimet e mundshme në InfluenzaNet, Trendet e Gripit të Google dhe sistemet tradicionale të ndjekjes së gripit.
  2. Konsideroni një kohë të pazgjidhur, siç është shpërthimi i një forme novacioni gripi. Përshkruani gabimet e mundshme në secilin sistem.
 3. [ i vështirë , kërkon kodim , Mbledhja e të dhënave ] Ekonomisti është një revistë javore e lajmeve. Krijo një projekt të llogaritjes njerëzore për të parë nëse raporti i grave me burrat në mbulesë ka ndryshuar me kalimin e kohës.

  1. Revista mund të ketë mbulime të ndryshme në tetë rajone të ndryshme (Afrika, Azia e Paqësorit, Evropa, Bashkimi Evropian, Amerika Latine, Lindja e Mesme, Amerika Veriore dhe Mbretëria e Bashkuar) dhe të gjitha mund të shkarkohen nga faqja e internetit e revistës. Zgjidh një nga këto rajone dhe kryejini analizën. Sigurohuni që të përshkruani procedurat tuaja me detaje të mjaftueshme që mund të përsëriten nga dikush tjetër.

  Kjo pyetje u frymëzua nga një projekt i ngjashëm nga Justin Tenuto, një shkencëtar i të dhënave në CrowdFlower të Crowdsourcing Company: shih "Time Magazine really likes dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

 4. [ shume e veshtire , kërkon kodim , Mbledhja e të dhënave ] Duke u bazuar në pyetjen e mëparshme, tani bëni analizën për të gjitha tetë rajonet.

  1. Çfarë ndryshimesh keni gjetur në të gjithë rajonet?
  2. Sa kohë dhe para shtesë e bënë që ta zgjeroni analizën tuaj në të tetë rajonet?
  3. Imagjinoni që Economist ka 100 mbulime të ndryshme çdo javë. Vlerësoni sa kohë dhe para shtesë do të duhej për të përmirësuar analizën tuaj në 100 mbulime në javë.
 5. [ i vështirë , kërkon kodim ] Ekzistojnë disa faqe interneti që mbajnë projekte të hapura për thirrje, të tilla si Kaggle. Merrni pjesë në një nga këto projekte dhe përshkruani atë që mësoni për atë projekt të veçantë dhe për thirrjet e hapura në përgjithësi.

 6. [ medium ] Shikoni përmes një numri të kohëve të fundit të një ditar në fushën tuaj. A ka ndonjë dokument që mund të ishte riformuluar si projekte për thirrje të hapura? Pse ose pse jo?

 7. [ i lehtë ] Purdam (2014) përshkruan një koleksion të shpërndarë të të dhënave rreth lypjes në Londër. Përmblidhni pikat e forta dhe dobësitë e këtij projekti kërkimor.

 8. [ medium ] Zbritja është një mënyrë e rëndësishme për të vlerësuar cilësinë e grumbullimit të të dhënave të shpërndara. Windt and Humphreys (2016) zhvilluan dhe testuan një sistem për të mbledhur raporte të ngjarjeve të konfliktit nga njerëzit në Kongo Lindore. Lexoni letrën.

  1. Si e siguron dizajni i tyre tepricë?
  2. Ata ofruan disa metoda për të vërtetuar të dhënat e mbledhura nga projekti i tyre. Përmblidhni ato. Cila ishte më bindëse për ju?
  3. Propozoni një mënyrë të re që të dhënat mund të vërtetohen. Sugjerimet duhet të përpiqen të rrisin besimin që do të keni në të dhënat në një mënyrë që është me kosto efektive dhe etike.
 9. [ medium ] Karim Lakhani dhe kolegët (2013) krijuan një thirrje të hapur për të kërkuar algoritme të reja për të zgjidhur një problem në biologjinë kompjuterike. Ata morën më shumë se 600 parashtresa që përmbanin 89 qasje të reja kompjuterike. Nga paraqitjet, 30 tejkaluan performancën e Institutit Kombëtarë të Shëndetit të MegaBLAST, dhe dorëzimi më i mirë arriti si saktësinë dhe shpejtësinë më të madhe (1,000 herë më të shpejtë).

  1. Lexoni letrën e tyre dhe më pas propozoni një problem të kërkimit shoqëror që mund të përdorë të njëjtin lloj të konkursit të hapur. Në veçanti, ky lloj i konkursit të hapur është përqendruar në përshpejtimin dhe përmirësimin e performancës së një algoritmi ekzistues. Nëse nuk mund të mendoni për një problem si kjo në fushën tuaj, përpiquni të shpjegoni pse jo.
 10. [ medium , my favorite ] Shumë projekte të llogaritjes njerëzore mbështeten tek pjesëmarrësit nga Amazon Mechanical Turk. Regjistrohu për t'u bërë një punëtor në Amazon Mechanical Turk. Kaloni një orë duke punuar atje. Si ndikon kjo në mendimet tuaja në lidhje me dizajnin, cilësinë dhe etikën e projekteve të llogaritjes njerëzore?