gweithgareddau

  • gradd anhawster: hawdd hawdd , canolig canolig , caled caled , yn galed iawn anodd iawn
  • angen mathemateg ( yn gofyn am fathemateg )
  • angen codio ( yn gofyn am godio )
  • casglu data ( casglu data )
  • fy ffefrynnau ( fy ffefryn )
  1. [ anodd iawn , yn gofyn am godio , casglu data , fy ffefryn ] Un o'r hawliadau mwyaf cyffrous o ymchwil Benoit a chydweithwyr (2016) ar godio torfau amlygrwydd gwleidyddol yw bod y canlyniadau yn atgynhyrchadwy. Merz, Regel, and Lewandowski (2016) darparu mynediad i'r Manifesto Corpus. Ceisiwch atgynhyrchu ffigur 2 o Benoit et al. (2016) gan ddefnyddio gweithwyr o Amazon Mechanical Turk. Pa mor debyg oedd eich canlyniadau?

  2. [ canolig ] Yn y prosiect InfluenzaNet mae panel o bobl gwirfoddol yn adrodd am yr achosion, amlder, ac ymddygiad sy'n ceisio iechyd sy'n gysylltiedig â salwch tebyg i ffliw (Tilston et al. 2010; Noort et al. 2015) .

    1. Cymharwch a chyferbynnwch ddyluniad, costau, a gwallau tebygol yn InfluenzaNet, Google Flu Trends, a systemau olrhain ffliw traddodiadol.
    2. Ystyriwch amser anffodus, fel achos o ffliw nofel. Disgrifiwch y gwallau posibl ym mhob system.
  3. [ caled , yn gofyn am godio , casglu data ] Mae'r Economegydd yn gylchgrawn newyddion wythnosol. Creu prosiect cyfrifo dynol i weld a yw'r gymhareb rhwng menywod a dynion ar y clawr wedi newid dros amser.

    1. Gall y cylchgrawn gael gwarediadau gwahanol mewn wyth rhanbarth gwahanol (Affrica, Asia Môr Tawel, Ewrop, yr Undeb Ewropeaidd, America Ladin, y Dwyrain Canol, Gogledd America, a'r Deyrnas Unedig) a gallant oll gael eu llwytho i lawr o wefan y cylchgrawn. Dewiswch un o'r rhanbarthau hyn a pherfformiwch y dadansoddiad. Gwnewch yn siŵr eich bod yn disgrifio'ch gweithdrefnau gyda digon o fanylion y gallent gael eu hailadrodd gan rywun arall.

    Ysbrydolwyd y cwestiwn hwn gan brosiect tebyg gan Justin Tenuto, gwyddonydd data yn y cwmni crowdsourcing CrowdFlower: gweler "Time Magazine Really Like Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ anodd iawn , yn gofyn am godio , casglu data ] Gan adeiladu ar y cwestiwn blaenorol, nawr yn perfformio'r dadansoddiad ar gyfer yr wyth rhanbarth.

    1. Pa wahaniaethau a ddarganfuwyd ar draws rhanbarthau?
    2. Faint o amser ac arian ychwanegol a gymerwyd i raddfa eich dadansoddiad i bob un o'r wyth o'r rhanbarthau?
    3. Dychmygwch fod gan yr Economegydd 100 o wahanol gwmpas bob wythnos. Amcangyfrif faint o amser ac arian ychwanegol y byddai'n ei gymryd i raddfa eich dadansoddiad i 100 yn cwmpasu yr wythnos.
  5. [ caled , yn gofyn am godio ] Mae sawl gwefan sy'n cynnal prosiectau galw agored, megis Kaggle. Cymryd rhan mewn un o'r prosiectau hynny, a disgrifiwch yr hyn rydych chi'n ei ddysgu am y prosiect penodol hwnnw ac am alwadau agored yn gyffredinol.

  6. [ canolig ] Edrychwch ar rifyn diweddar o gyfnodolyn yn eich maes. A oes unrhyw bapurau y gellid eu haddasu fel prosiectau galw agored? Pam neu pam?

  7. [ hawdd ] Mae Purdam (2014) disgrifio casgliad data wedi'i ddosbarthu am begging yn Llundain. Crynhowch gryfderau a gwendidau'r dyluniad ymchwil hwn.

  8. [ canolig ] Mae dileu swydd yn ffordd bwysig o asesu ansawdd casglu data dosbarthedig. Datblygodd a phrofi system Windt and Humphreys (2016) i gasglu adroddiadau o ddigwyddiadau gwrthdaro gan bobl yn Nwyrain Congo. Darllenwch y papur.

    1. Sut mae eu dyluniad yn sicrhau colli swydd?
    2. Cynigiwyd nifer o ddulliau i ddilysu'r data a gasglwyd o'u prosiect. Crynhowch nhw. Pa un oedd fwyaf argyhoeddiadol i chi?
    3. Cynnig ffordd newydd y gellid dilysu'r data. Dylai awgrymiadau geisio cynyddu'r hyder y byddech yn ei gael yn y data mewn ffordd sy'n gost-effeithiol a moesegol.
  9. [ canolig ] Creodd Karim Lakhani a chydweithwyr (2013) alwad i chwilio am algorithmau newydd i ddatrys problem mewn bioleg gyfrifiadurol. Cawsant fwy na 600 o gyflwyniadau yn cynnwys 89 o ddulliau cyfrifiadurol newydd. O'r cyflwyniadau, roedd 30 yn rhagori ar berfformiad MegaBLAST Sefydliadau Cenedlaethol Cenedlaethol yr UD, a chyflawnodd y cyflwyniad gorau yn fwy cywirdeb a chyflymder (1,000 gwaith yn gyflymach).

    1. Darllenwch eu papur, ac yna cynnig problem ymchwil gymdeithasol a allai ddefnyddio'r un math o gystadleuaeth agored. Yn benodol, mae'r math hwn o gystadleuaeth agored yn canolbwyntio ar gyflymu a gwella perfformiad algorithm presennol. Os na allwch feddwl am broblem fel hyn yn eich maes, ceisiwch esbonio pam.
  10. [ canolig , fy ffefryn ] Mae llawer o brosiectau cyfrifo dynol yn dibynnu ar gyfranogwyr o Amazon Mechanical Turk. Cofrestrwch i fod yn weithiwr ar Amazon Mecanyddol Turk. Treuliwch un awr yn gweithio yno. Sut mae hyn yn effeithio ar eich meddyliau am ddyluniad, ansawdd a moeseg prosiectau cyfrifo dynol?