gweithgareddau

allwedd:

  • rhywfaint o anhawster: hawdd hawdd , canolig canolig , yn galed caled , Yn galed iawn yn galed iawn
  • ei gwneud yn ofynnol mathemateg ( ei gwneud yn ofynnol mathemateg )
  • ei gwneud yn ofynnol codio ( ei gwneud yn ofynnol codio )
  • casglu data ( casglu data )
  1. [ yn galed iawn , ei gwneud yn ofynnol codio , casglu data ] Un o'r ceisiadau mwyaf cyffrous o Benoit et al. (2015) ar dorf-chodio maniffestos gwleidyddol yw bod y canlyniadau yn atgynyrchadwy. Merz, Regel, and Lewandowski (2016) yn darparu mynediad at y Maniffesto Corpus. Ceisiwch i atgynhyrchu Ffig 2 o Benoit et al. (2015) gan ddefnyddio gweithwyr o Amazon Mecanyddol Turk. Pa mor debyg oedd eich canlyniadau?

  2. [ canolig ] Yn y prosiect InfluenzaNet panel gwirfoddol o bobl yn gwybod am yr achosion, mynychder, ac ymddygiad sy'n ceisio iechyd sy'n gysylltiedig â ffliw-salwch (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. Cymharwch a chyferbynnwch y dylunio, costau, a gwallau tebygol yn InfluenzaNet, Tueddiadau Ffliw Google, a systemau olrhain ffliw traddodiadol.
    2. Ystyriwch amser ansefydlog, megis yr achos ffliw moch. Disgrifiwch y gwallau posibl ym mhob system.
  3. [ caled , ei gwneud yn ofynnol codio , casglu data ] The Economist yn gylchgrawn newyddion wythnosol. Creu prosiect cyfrifiant dynol i weld os yw'r gymhareb o fenywod i ddynion ar y clawr wedi cynyddu dros amser.

    1. Gall y cylchgrawn gwahanol gloriau mewn wyth rhanbarth gwahanol (Affrica, Asia a'r Môr Tawel, Ewrop, yr Undeb Ewropeaidd, America Ladin, y Dwyrain Canol, Gogledd America, ac y Deyrnas Unedig) a gallant oll gael eu llwytho i lawr o wefan The Economist . Dewiswch un o'r rhanbarthau hyn a cyflawni'r dadansoddiad. Byddwch yn siwr i ddisgrifio eich gweithdrefnau gyda digon o fanylion y gellid eu hailadrodd gan rywun arall.

    Y cwestiwn hwn ei ysbrydoli gan brosiect tebyg gan Justin Tenuto, gwyddonydd data yn y cwmni crowdsourcing CrowdFlower , gweler "Time Magazine Really Yn hoffi Dudes" .

  4. [ yn galed iawn , ei gwneud yn ofynnol codio , casglu data ] Gan adeiladu ar y cwestiwn uchod, yn awr cyflawni'r dadansoddiad ar gyfer pob wyth rhanbarth.

    1. Pa wahaniaethau wnaethoch chi ddod o hyd ar draws rhanbarthau?
    2. Faint ychwanegol o amser ac arian wnaeth hi gymryd i raddfa i fyny eich dadansoddiad i bob un o'r wyth o ranbarthau?
    3. Dychmygwch fod y Economist Mae 100 o gloriau gwahanol bob wythnos. Amcangyfrifwch faint o amser ychwanegol ac arian y byddai'n ei gymryd i raddfa i fyny eich dadansoddiad at 100 cloriau yr wythnos.
  5. [ caled , ei gwneud yn ofynnol codio ] [Kaggle] (https://www.kaggle.com/) yn wefan sy'n cynnal prosiectau galwad agored. Cymryd rhan mewn un o'r prosiectau hynny.

  6. [ canolig ] Edrychwch drwy rhifyn diweddar o gylchgrawn yn eich maes. A oes unrhyw bapurau y gellid bod wedi'u hailffurfio fel prosiectau galwad agored? Pam neu pam ddim?

  7. [ hawdd ] Purdam (2014) a ddisgrifir yn casglu data a ddosberthir am gardota yn Llundain. Crynhoi'r cryfderau a gwendidau hon cynllun ymchwil.

  8. [ canolig ] Diswyddo yn ffordd bwysig i asesu ansawdd y casglu data ddosbarthu. Windt and Humphreys (2016) datblygu a phrofi system i gasglu adroddiadau o ddigwyddiadau gwrthdaro o bobl yn Nwyrain Congo. Darllenwch y papur.

    1. Sut mae eu dyluniad yn sicrhau diswyddo?
    2. Maent yn cynnig sawl dull i ddilysu'r data a gasglwyd oddi wrth eu prosiect. Crynhoi nhw. P'un oedd y rhan fwyaf argyhoeddiadol i chi?
    3. Cynnig i ffordd newydd y gallai'r data gael ei ddilysu. Dylai awgrymiadau ceisio cynyddu hyder y byddai gennych yn y data mewn ffordd sy'n gost-effeithiol a moesegol.
  9. [ canolig ] Karim Lakhani a chydweithwyr (2013) creu galwad agored i ofyn am algorithmau newydd i ddatrys problem mewn bioleg gyfrifiannol. Maent yn derbyn mwy na 600 o gyflwyniadau sy'n cynnwys 89 o ddulliau cyfrifiannu nofel. O'r cyflwyniadau, cawsant 30 y rhagori ar berfformiad yr Unol Daleithiau Sefydliad Cenedlaethol dros MegaBLAST Iechyd, a chyflawnodd y cyflwyniad gorau ddau mwy o gywirdeb a chyflymder (1,000 gwaith yn gyflymach).

    1. Darllenwch eu papur, ac yna yn cynnig problem ymchwil cymdeithasol a allai ddefnyddio'r un math o gystadleuaeth agored. Yn benodol, y math hwn o gystadleuaeth agored yn canolbwyntio ar gyflymu a gwella perfformiad algorithm sy'n bodoli eisoes. Os na allwch feddwl am broblem fel hyn yn eich maes, yn ceisio egluro pam.
  10. [ canolig ] Mae llawer o brosiectau cyfrifiant dynol yn dibynnu ar gyfranogwyr o Amazon Mecanyddol Turk. Cofrestrwch i fyny i fod yn weithiwr ar Amazon Mecanyddol Turk. Treuliwch awr yn gweithio yno. Sut mae hyn yn effeithio ar eich barn am y dyluniad, ansawdd, a moeseg o brosiectau compuation dynol?