toimet

  • vaikeusaste: helppo helppo , keskitaso keskikokoinen , kova kova , tosi kovasti tosi kovasti
  • edellyttää matematiikkaa ( vaatii matematiikkaa )
  • koodaus ( vaatii koodauksen )
  • tiedonkeruu ( tiedonkeruu )
  • suosikkini ( suosikkini )
  1. [ tosi kovasti , vaatii koodauksen , tiedonkeruu , suosikkini ] Yksi Benoitin ja kollegojen (2016) tutkimuksista väkijoukkojen koodauksesta on yksi tuloksista, jotka ovat toistettavia. Merz, Regel, and Lewandowski (2016) tarjoavat pääsyn Manifesto Corpukseen. Yritä toistaa kuvio 2 Benoit et al. (2016) käyttäen Amazon Mechanical Turkin työntekijöitä. Kuinka samankaltaiset tuloksesi olivat?

  2. [ keskikokoinen ] InfluenzaNet-projektissa vapaaehtoisten paneeli kertoo influenssan kaltaisen sairauden esiintyvyydestä, esiintyvyydestä ja terveydestä haitallisesta käyttäytymisestä (Tilston et al. 2010; Noort et al. 2015) .

    1. Vertaa ja ristiriidassa InfluenzaNetin, Google Influenza Trendsin ja perinteisten influenssan seurantajärjestelmien suunnitteluun, kustannuksiin ja todennäköisiin virheisiin.
    2. Harkitse epävakaata aikaa, kuten uuden influenssaviruksen puhkeamista. Kuvaile mahdollisia virheitä kussakin järjestelmässä.
  3. [ kova , vaatii koodauksen , tiedonkeruu ] The Economist on viikoittainen uutislehti. Luo ihmisen laskentaprojekti nähdäksesi, onko naisten ja miesten suhde kansiin muuttunut ajan myötä.

    1. Lehdellä voi olla eri kansiot kahdeksalla eri alueella (Afrikka, Aasia, Eurooppa, Euroopan unioni, Latinalainen Amerikka, Lähi-itä, Pohjois-Amerikka ja Iso-Britannia) ja ne voidaan ladata lehden verkkosivuilta. Valitse yksi näistä alueista ja tee analyysi. Varmista, että kuvaat menettelytapasi niin yksityiskohtaisesti, että joku muu voisi toistaa ne.

    Tämä kysymys innoitti vastaavan projektin Justin Tenuto, tietotaidosta crowdourcing-yritys CrowdFlower: katso "Time Magazine todella tykkää Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ tosi kovasti , vaatii koodauksen , tiedonkeruu ] Edelliseen kysymykseen pohjautuu nyt analyysi kahdeksalle alueelle.

    1. Mitä eroja löytyi eri alueilla?
    2. Kuinka paljon ylimääräistä aikaa ja rahaa se teki analyysin laajentamiseksi kahdeksaan alueeseen?
    3. Kuvittele, että Economistilla on 100 eri kansiota joka viikko. Arvioi, kuinka paljon ylimääräistä aikaa ja rahaa se tarvitsisi analysoinnin laajentamiseksi 100 kansiin viikossa.
  5. [ kova , vaatii koodauksen ] On useita verkkosivustoja, jotka ylläpitävät avoimia projekteja, kuten Kaggle. Osallistu johonkin näistä hankkeista ja kerro siitä, mitä opit tästä projektista ja avoimet puhelut yleensä.

  6. [ keskikokoinen ] Katso alan viimeisintä julkaisua. Onko olemassa papereita, jotka olisi voitu muotoilla avoimiksi projekteiksi? Miksi tai miksi ei?

  7. [ helppo ] Purdam (2014) kuvaa hajautettua tietoa keräilystä Lontoossa. Yhteenveto tämän tutkimussuunnitelman vahvuuksista ja heikkouksista.

  8. [ keskikokoinen ] Redundanssi on tärkeä tapa arvioida hajautetun tiedonkeruun laatua. Windt and Humphreys (2016) kehittivät ja testattiin järjestelmää, jossa kerättiin raportteja ristiriitojen tapahtumista Itä-Kongon ihmisistä. Lue paperi.

    1. Miten niiden muotoilu varmistaa redundanssi?
    2. He tarjosivat useita lähestymistapoja hankkeensa kerättyjen tietojen validoimiseksi. Yhteenveto niistä. Mikä oli sinulle kaikkein vakuuttavin?
    3. Suunnittele uusi tapa, jolla tiedot voitiin validoida. Ehdotusten olisi pyrittävä lisäämään luottamusta tietojen luotettavuuteen kustannustehokkaalla ja eettisellä tavalla.
  9. [ keskikokoinen ] Karim Lakhani ja kollegat (2013) loivat avoimen puhelun pyytääkseen uusia algoritmeja ongelman ratkaisemiseksi laskennallisen biologian alalla. He saivat yli 600 hakemusta, jotka sisälsivät 89 uutta laskennallista lähestymistapaa. Esityksistä 30 ylitti USA: n National Institutes of Healthin MegaBLASTin tulokset, ja paras ehdotus saavutti sekä suuremman tarkkuuden että nopeuden (1000 kertaa nopeammin).

    1. Lue heidän paperinsa ja sitten ehdottaa sosiaalista tutkimusongelmaa, joka voisi käyttää samanlaista avointa kilpailua. Erityisesti tällainen avoin kilpailu keskittyy olemassa olevan algoritmin nopeuttamiseen ja parantamaan suorituskykyä. Jos et voi ajatella tällaista ongelmaa tällä alalla, yritä selittää, miksi et.
  10. [ keskikokoinen , suosikkini ] Monet ihmisen laskentaprojektit perustuvat Amazon Mechanical Turkin osanottajiin. Rekisteröidy työntekijäksi Amazon Mechanical Turkilla. Vietä tunti siellä. Miten tämä vaikuttaa ajatuksiin ihmisen laskentaprojektien suunnittelusta, laadusta ja etiikasta?