aktivity

Klíč:

  • Stupeň obtížnosti: lehká snadný , středně střední tvrdé tvrdý , velmi těžké velmi těžké
  • vyžaduje matematiku ( vyžaduje matematiku )
  • vyžaduje kódování ( vyžaduje kódování )
  • sběr dat ( sběr dat )
  1. [ velmi těžké , vyžaduje kódování , sběr dat ] Jeden z nejvíce vzrušujících pohledávek z Benoit et al. (2015) na dav-kódování politických manifestů je, že výsledky jsou reprodukovatelné. Merz, Regel, and Lewandowski (2016) poskytuje přístup k manifestu korpusu. Pokusit se reprodukovat obr 2 z Benoit et al. (2015) za použití pracovníky z Amazon Mechanical Turk. Jak podobné byly vaše výsledky?

  2. [ střední ] V InfluenzaNet projektu dobrovolník panel lidí, kteří hlásí výskyt, rozšíření a zdravotní hledá chování související s chřipkové-onemocněních (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. Srovnat a odlišit design, náklady a pravděpodobné chyby v InfluenzaNet Chřipkové trendy Google a tradiční sledovací systémy chřipky.
    2. Vezměme si pohnutou dobu, jako je prasečí chřipky. Popište případné chyby v každém systému.
  3. [ tvrdý , vyžaduje kódování , sběr dat ] The Economist je týdenní zpravodajský časopis. Vytvoření lidskou výpočetní projekt, aby zjistili, zda je poměr žen k mužům na obálce zvýšila v průběhu času.

    1. Časopis může mít různé kryty v osmi různých regionech (Afrika, Asie a Tichomoří, Evropa, Evropská unie, Latinské Ameriky, Středního východu, Severní Ameriky a Spojené království) a mohou být všechny stáhnout z webové stránky The Economist . Vyberte si jeden z těchto regionů a provést analýzu. Ujistěte se, že popisovat své postupy s dostatkem detailů, které by mohly být replikovány někdo jiný.

    Tato otázka byla inspirována obdobným projektu Justin tenuto, datové vědec na crowdsourcing společnosti CrowdFlower , viz "Time Magazine má opravdu rád Dudes" .

  4. [ velmi těžké , vyžaduje kódování , sběr dat ] V návaznosti na výše uvedenou otázku, nyní provádět analýzu všech osmi krajích.

    1. Jaké rozdíly jste našel napříč regiony?
    2. Jak moc extra času a peněz trvalo škálovat-up svou analýzu na všech osmi regionech?
    3. Představme si, že Economist má 100 různých krytů každý týden. Odhadnout, jak moc extra času a peněz to bude trvat škálovat-up vaší analýzy 100 krytů týdně.
  5. [ tvrdý , vyžaduje kódování ] [Kaggle] (https://www.kaggle.com/) je webová stránka, která je hostitelem otevřených projektů volání. Podílet se na jedné z těchto projektů.

  6. [ střední ] Podívejte se nedávném vydání časopisu ve svém oboru. Existují nějaké papíry, které by byly přeformulovány jako projekty Otevřená výzva? Proč nebo proč ne?

  7. [ snadný ] Purdam (2014) popsal distribuovaný sběr dat o žebrání v Londýně. Shrnout silné a slabé stránky tohoto výzkumného záměru.

  8. [ střední ] Redundance je důležitý způsob, jak hodnotit kvalitu distribuovaného sběru dat. Windt and Humphreys (2016) vyvinout a otestovat systém pro sběr zpráv o konfliktu událostí od lidí ve východním Kongu. Číst noviny.

    1. Jak se jejich konstrukce zajistí redundanci?
    2. Nabízejí několik přístupů k ověření dat získaných z jejich projektu. Shrnout je. Což bylo Nejpřesvědčivější pro vás?
    3. Navrhnout nový způsob, že údaje by mohly být potvrzen. Návrhy by se měly snažit zvýšit jistotu, že budete muset v datech způsobem, který je nákladově efektivní a etické.
  9. [ střední ] Karim Lakhani a jeho kolegové (2013) vytvořil otevřenou výzvu vyžádat nové algoritmy vyřešit problém ve výpočetní biologii. Dostalo se jim více než 600 podání, které obsahují 89 nových výpočetních přístupů. Z toho, co tvrdí, že obdržela 30, která překročila výkonnost US National Institutes of Health Megablast, a nejlepší podání dosaženo i větší přesnost a rychlost (1000 krát rychlejší).

    1. Číst jejich noviny, a pak navrhnout nějaký problém sociálního výzkumu, které by mohly používat stejný druh otevřené soutěže. Zejména tento druh otevřené soutěže je zaměřen na urychlení a zlepšení výkonu stávajícího algoritmu. Pokud nemůžete myslet na problém, jako je tento ve svém oboru, se snaží vysvětlit, proč ne.
  10. [ střední ] Mnoho výpočetní projekty v oblasti lidských spoléhají na účastníky z Amazon Mechanical Turk. Sign-up, aby se stal pracovníkem na Amazon Mechanical Turk. Strávit hodinu tam pracovat. Jak to ovlivnit vaše myšlenky o design, kvalitu a etika compuation projektů v oblasti lidských?