aktivity

Klíč:

 • Stupeň obtížnosti: lehká snadný , středně střední tvrdé tvrdý , velmi těžké velmi těžké
 • vyžaduje matematiku ( vyžaduje matematiku )
 • vyžaduje kódování ( vyžaduje kódování )
 • sběr dat ( sběr dat )
 1. [ velmi těžké , vyžaduje kódování , sběr dat ] Jeden z nejvíce vzrušujících pohledávek z Benoit et al. (2015) na dav-kódování politických manifestů je, že výsledky jsou reprodukovatelné. Merz, Regel, and Lewandowski (2016) poskytuje přístup k manifestu korpusu. Pokusit se reprodukovat obr 2 z Benoit et al. (2015) za použití pracovníky z Amazon Mechanical Turk. Jak podobné byly vaše výsledky?

 2. [ střední ] V InfluenzaNet projektu dobrovolník panel lidí, kteří hlásí výskyt, rozšíření a zdravotní hledá chování související s chřipkové-onemocněních (ILI) (Tilston et al. 2010; Noort et al. 2015) .

  1. Srovnat a odlišit design, náklady a pravděpodobné chyby v InfluenzaNet Chřipkové trendy Google a tradiční sledovací systémy chřipky.
  2. Vezměme si pohnutou dobu, jako je prasečí chřipky. Popište případné chyby v každém systému.
 3. [ tvrdý , vyžaduje kódování , sběr dat ] The Economist je týdenní zpravodajský časopis. Vytvoření lidskou výpočetní projekt, aby zjistili, zda je poměr žen k mužům na obálce zvýšila v průběhu času.

  1. Časopis může mít různé kryty v osmi různých regionech (Afrika, Asie a Tichomoří, Evropa, Evropská unie, Latinské Ameriky, Středního východu, Severní Ameriky a Spojené království) a mohou být všechny stáhnout z webové stránky The Economist . Vyberte si jeden z těchto regionů a provést analýzu. Ujistěte se, že popisovat své postupy s dostatkem detailů, které by mohly být replikovány někdo jiný.

  Tato otázka byla inspirována obdobným projektu Justin tenuto, datové vědec na crowdsourcing společnosti CrowdFlower , viz "Time Magazine má opravdu rád Dudes" .

 4. [ velmi těžké , vyžaduje kódování , sběr dat ] V návaznosti na výše uvedenou otázku, nyní provádět analýzu všech osmi krajích.

  1. Jaké rozdíly jste našel napříč regiony?
  2. Jak moc extra času a peněz trvalo škálovat-up svou analýzu na všech osmi regionech?
  3. Představme si, že Economist má 100 různých krytů každý týden. Odhadnout, jak moc extra času a peněz to bude trvat škálovat-up vaší analýzy 100 krytů týdně.
 5. [ tvrdý , vyžaduje kódování ] [Kaggle] (https://www.kaggle.com/) je webová stránka, která je hostitelem otevřených projektů volání. Podílet se na jedné z těchto projektů.

 6. [ střední ] Podívejte se nedávném vydání časopisu ve svém oboru. Existují nějaké papíry, které by byly přeformulovány jako projekty Otevřená výzva? Proč nebo proč ne?

 7. [ snadný ] Purdam (2014) popsal distribuovaný sběr dat o žebrání v Londýně. Shrnout silné a slabé stránky tohoto výzkumného záměru.

 8. [ střední ] Redundance je důležitý způsob, jak hodnotit kvalitu distribuovaného sběru dat. Windt and Humphreys (2016) vyvinout a otestovat systém pro sběr zpráv o konfliktu událostí od lidí ve východním Kongu. Číst noviny.

  1. Jak se jejich konstrukce zajistí redundanci?
  2. Nabízejí několik přístupů k ověření dat získaných z jejich projektu. Shrnout je. Což bylo Nejpřesvědčivější pro vás?
  3. Navrhnout nový způsob, že údaje by mohly být potvrzen. Návrhy by se měly snažit zvýšit jistotu, že budete muset v datech způsobem, který je nákladově efektivní a etické.
 9. [ střední ] Karim Lakhani a jeho kolegové (2013) vytvořil otevřenou výzvu vyžádat nové algoritmy vyřešit problém ve výpočetní biologii. Dostalo se jim více než 600 podání, které obsahují 89 nových výpočetních přístupů. Z toho, co tvrdí, že obdržela 30, která překročila výkonnost US National Institutes of Health Megablast, a nejlepší podání dosaženo i větší přesnost a rychlost (1000 krát rychlejší).

  1. Číst jejich noviny, a pak navrhnout nějaký problém sociálního výzkumu, které by mohly používat stejný druh otevřené soutěže. Zejména tento druh otevřené soutěže je zaměřen na urychlení a zlepšení výkonu stávajícího algoritmu. Pokud nemůžete myslet na problém, jako je tento ve svém oboru, se snaží vysvětlit, proč ne.
 10. [ střední ] Mnoho výpočetní projekty v oblasti lidských spoléhají na účastníky z Amazon Mechanical Turk. Sign-up, aby se stal pracovníkem na Amazon Mechanical Turk. Strávit hodinu tam pracovat. Jak to ovlivnit vaše myšlenky o design, kvalitu a etika compuation projektů v oblasti lidských?