darbības

Key:

  • sarežģītības pakāpi: viegli viegli , vidēja vidējs , cietais grūti , ļoti grūti ļoti grūti
  • prasa matemātiku ( prasa matemātiku )
  • prasa kodēšana ( prasa kodēšana )
  • datu vākšana ( datu vākšana )
  1. [ ļoti grūti , prasa kodēšana , datu vākšana ] Viena no aizraujošākajām pretenzijām no Benoit et al. (2015) par pūļa kodēšanu politisko manifestu ir tā, ka rezultāti būtu atkārtojami. Merz, Regel, and Lewandowski (2016) nodrošina piekļuvi manifests korpusa. Mēģiniet reproducēt Att 2 no Benoit et al. (2015) , izmantojot darba ņēmējus no Amazon Mechanical Turk. Kā līdzīgs bija jūsu rezultātus?

  2. [ vidējs ] Jo InfluenzaNet projektā brīvprātīgais panelis cilvēki ziņo biežums, izplatība, un veselības cenšas uzvedību, kas saistīts ar gripai līdzīgu-slimību (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. Salīdzināt un pretstatīt dizainu, izmaksas un iespējamos kļūdas InfluenzaNet, pakalpojumā Google gripas izplatība, un tradicionālās gripas izsekošanas sistēmas.
    2. Apsveriet neizpildītajiem laiku, piemēram, cūku gripas uzliesmojums. Aprakstīt iespējamās kļūdas katrā sistēmā.
  3. [ grūti , prasa kodēšana , datu vākšana ] The Economist ir iknedēļas ziņu žurnāls. Izveidot cilvēka skaitļošanas projektu, lai redzētu, ja sieviešu īpatsvars vīriešiem uz vāka laika gaitā ir palielinājies.

    1. Žurnāls var būt dažādas vāki astoņos dažādos reģionos (Āfrikā, Āzijā un Klusā okeāna, Eiropas, Eiropas Savienības, Latīņamerikas, Tuvo Austrumu, Ziemeļamerika, un Apvienotā Karaliste), un tos visus var lejupielādēt no tīmekļa vietnes The Economist . Izvēlieties vienu no šiem reģioniem un veiktu analīzi. Noteikti aprakstiet savas procedūras ar pietiekami detalizēti, ka tie varētu pārņemt kāds cits.

    Šis jautājums iedvesmoja līdzīgu projektu ar Justin Tenuto, datu zinātnieks pie crowdsourcing uzņēmumu CrowdFlower , skatiet "Time Magazine Really Patīk Dudes" .

  4. [ ļoti grūti , prasa kodēšana , datu vākšana ] Balstoties uz iepriekš uz jautājumu, tagad veiktu analīzi par visiem astoņiem reģioniem.

    1. Kādas atšķirības jūs atradīsiet visos reģionos?
    2. Cik daudz papildus laika un naudas tas veic ar skalu-up jūsu analīzi visa astoņiem reģionu?
    3. Iedomājieties, ka Economist ir 100 dažādu vākus katru nedēļu. Novērtēt, cik daudz papildu laika un naudas tas veic, lai mērogu-up jūsu analīzi 100 vākiem nedēļā.
  5. [ grūti , prasa kodēšana ] [Kaggle] (https://www.kaggle.com/) ir tīmekļa vietne, kas uzņem atklāta konkursa projektu. Piedalīties kādā no šiem projektiem.

  6. [ vidējs ] Apskatīt nesenā izsniegšanas žurnālā savā jomā. Vai ir kādi dokumenti, kas varētu būt pārformulētie atklātā konkursa projektiem? Kāpēc Vai kāpēc nē?

  7. [ viegli ] Purdam (2014) aprakstīja izplatīts datu vākšanu par ubagošanu Londonā. Apkopo stiprās un vājās puses šī pētījuma dizainu.

  8. [ vidējs ] Atlaišana ir svarīgs veids, kā novērtēt izplatīto datu vākšanas kvalitāti. Windt and Humphreys (2016) izstrādāt un pārbaudīt sistēmu, apkopot pārskatus par konflikta notikumus no cilvēkiem Kongo austrumos. Lasīt papīru.

    1. Kā to dizains nodrošinātu atlaišanas?
    2. Tie piedāvā vairākas pieejas, lai apstiprinātu datus, kas savākti no sava projekta. Apkopot tos. Kas bija visvairāk pārliecinošs, lai jums?
    3. Ierosināt jaunu veidu, ka dati varētu tikt apstiprinātas. Ieteikumi jāmēģina palielināt pārliecību, ka jums būtu datos tādā veidā, kas ir rentabli un ētikas.
  9. [ vidējs ] Karim Lakhani un kolēģi (2013) izveidoja atklātu aicinājumu lūgt jaunus algoritmus, lai atrisinātu problēmu skaitļošanas bioloģijā. Viņi saņēma vairāk nekā 600 iesniegumus, kas satur 89 jaunas skaitļošanas metodes. No iesniegumiem, viņi saņēma 30, kas pārsniedz sniegumu ASV National Institutes of Health MegaBLAST, un labākais iesniegšana panākt gan lielāku precizitāti un ātrumu (1000 reizes ātrāk).

    1. Lasīt savu papīru, un tad ierosināt sociālo pētījumu problēmas, kas varētu izmantot tāda paša veida atklātā konkursā. Jo īpaši šāda veida atklātā konkursā ir vērsta uz to, kā paātrināt un uzlabot veiktspēju esošas algoritmu. Ja jūs nevarat iedomāties problēmas, piemēram, tas savā jomā, cenšas izskaidrot, kāpēc ne.
  10. [ vidējs ] Daudzi cilvēktiesību Aprēķina projekti paļauties uz dalībniekiem no Amazon Mechanical Turk. Sign-up kļūt darbinieks par Amazon Mechanical Turk. Pavadīt vienu stundu tur strādāt. Kā tas ietekmēs jūsu domas par dizainu, kvalitāti un ētika cilvēku compuation projektiem?