jarduerak

Gakoa:

  • Zailtasun-maila: erraza erraza , ertain medium , hard gogor , Oso gogorra Oso gogorra
  • math eskatzen ( math eskatzen )
  • eskatzen kodifikazioa ( eskatzen kodetze )
  • datu bilketa ( datu bilketa )
  1. [ Oso gogorra , eskatzen kodetze , datu bilketa ] Tik zirraragarrienetariko erreklamazio bat Benoit et al. (2015) , manifestu politiko jendetza-kodetze on da, emaitzak berregin. Merz, Regel, and Lewandowski (2016) Manifestua Corpus sarbidea ematen. Saiatu Fig 2 berregiteko batetik Benoit et al. (2015) Amazon Turk mekanikoa langile erabiliz. Nola antzekoak izan ziren zure emaitza?

  2. [ medium ] InfluenzaNet proiektuan boluntario pertsona panel berri du intzidentzia, prebalentzia, eta osasun bila gripe-like-gaixotasuna (ILI) lotutako portaera (Tilston et al. 2010; Noort et al. 2015) .

    1. Konparatu eta diseinua, kostuak, eta InfluenzaNet, Google Gripearen joerak ere Akats, eta ohiko gripearen jarraipena sistemak kontrastatu.
    2. Demagun astinduaren denbora bat, hala nola, txerri gripearen agerraldia gisa. ahalik eta akatsak deskribatzea sistema bakoitzeko.
  3. [ gogor , eskatzen kodetze , datu bilketa ] Economist asteko albiste aldizkari bat da. Sortu giza konputazioaren proiektu bat emakumeen ratioa gizon azalean denbora gora egin ala ez ikusteko.

    1. Aldizkariaren zortzi eskualde ezberdinetan (Afrika, Asia Pazifikoko, Europan, Europar Batasuneko eta Latinoamerika, Ekialde Hurbila, Ipar Amerika, eta Erresuma Batua) azalak ezberdinak izan ditzake eta ezin dirade guciac webgunetik jaitsi Economist . Aukeratu eskualde horietako bat, eta analisia egiteko. Ziurtatu zure prozedurak deskribatzeko nahikoa xehetasun dutela beste norbaitek litezke erreplika batekin.

    Galdera hau antzeko proiektu bat Justin Tenuto, datuak crowdsourcing enpresa zientzialari batek inspiratu CrowdFlower , ikus "Time Magazine benetan gustuko Dudes" .

  4. [ Oso gogorra , eskatzen kodetze , datu bilketa ] Galderaren gainetik eraikitzeko, Azterketa egiteko zortzi eskualde guztietan.

    1. Zer ezberdintasun zenuen eskualdetan aurkitu?
    2. Zenbat denbora gehigarria eta dirua zuen eskalatzeko-up zure analisi guztiak eskualdeetako zortzi hartu?
    3. Imajinatu Economist dela 100 azalak desberdinak aste bakoitzean. Kalkulatzea zenbat denbora gehigarria eta dirua litzateke eskala-up zure analisi astean 100 azalak hartu.
  5. [ gogor , eskatzen kodetze ] [Kaggle] (https://www.kaggle.com/) dei proiektu irekia acoge webgune bat da. proiektu horietan parte hartzea.

  6. [ medium ] Soroan aldizkari bat azken gai baten bidez begiratu. Ba al dago baita beharbada deialdi irekia proiektu gisa birformulatu edozein paperak? Zergatik ez?

  7. [ erraza ] Purdam (2014) Londresen eske buruz banatutako datu bilketa bat deskribatu. Laburtzeko indarguneak eta ahuleziak ikerketa diseinu hau.

  8. [ medium ] Erredundantzia banatutako datuen bilketa kalitatea ebaluatzeko bide garrantzitsu bat da. Windt and Humphreys (2016) garatu eta sistema bat probatzeko Ekialdeko Kongoko pertsona batetik gatazka gertaeren txostenak biltzeko. Irakurri paperean.

    1. Nola bere diseinua duela bermatzeko erredundantzia?
    2. hainbat planteamendu, beren proiektu bildutako datuak balioztatzeko eskaintzen dute. Roll horiek. Zein izan da gehien nahi konbentzitzen?
    3. Proposa modu berri bat da, datuak balidatu ahal izango dira. Iradokizunak konfiantza duten modu bat kostu-eraginkorra eta etikoa da, datuak ere izango litzateke handitzeko saiatu beharko.
  9. [ medium ] Karim Lakhani eta lankideek (2013) deialdi irekia algoritmo berriak solicit biologia konputazionala arazo bat konpontzeko sortu. 89 konputazional planteamendu eleberria dituen 600 baino gehiago aurkeztu zuten jaso. aurkeztutakoetatik, 30 US National Osasun MegaBLAST Institutu errendimendua gainditzen duten jaso dute, eta aurkezteko onenak bai zehaztasun handiagoa eta abiadura (1.000 aldiz azkarragoa) lortu.

    1. Irakurri bere paper, eta, ondoren, lehiaketa irekia mota bera erabili izan duten gizarte ikerketa arazoren bat proposatzeko. Hain zuzen ere, lehiaketa irekia mota hau da azkartu eta dauden algoritmo bat errendimendua hobetzeko bideratuta. Ezin baduzu hau zure eremuan arazoa bezala pentsatzea, saiatu zergatik ez azaltzeko.
  10. [ medium ] Giza konputazioaren proiektu askok Amazon Turk mekanikoa partaideen oinarritzea. Kontu-up Amazon Turk mekanikoa langile bat bihurtu da. Pasa ordu bat han lanean. Nola egiten du inpaktu hau zure pentsamenduak buruz diseinu, kalitate eta etika giza compuation proiektuak?