Tevékenységek

  • nehézségi fok: könnyű könnyen , közepes közepes , kemény kemény , nagyon nehéz nagyon nehéz
  • matematikai követelményt igényel ( matematikai követelményt igényel )
  • kódolást igényel ( kódolást igényel )
  • adatgyűjtés ( adatgyűjtés )
  • a kedvenceim ( a kedvencem )
  1. [ nagyon nehéz , kódolást igényel , adatgyűjtés , a kedvencem ] Benoit és kollégáinak (2016) egyik legizgalmasabb állítása, hogy a politikai manifesztok tömegkódolását kutatják, az eredmények reprodukálhatóak. Merz, Regel, and Lewandowski (2016) hozzáférést biztosít a Manifesto Corpus számára. Próbálja meg reprodukálni a 2. ábrát Benoit et al. (2016) az Amazon Mechanical Turk dolgozóit használva. Milyen hasonló volt az eredménye?

  2. [ közepes ] Az InfluenzaNet projektben az önkéntes panel az influenza-szerű megbetegedések előfordulási gyakoriságáról, prevalenciájáról és egészségmegőrző viselkedéséről számol be (Tilston et al. 2010; Noort et al. 2015) .

    1. Az InfluenzaNet, a Google Influenzatrendek és a hagyományos influenza-nyomkövető rendszerek tervezésével, költségeivel és valószínű hibáival hasonlíthatók össze és szembesülnek.
    2. Vegyünk egy rendíthetetlen időt, például egy újfajta influenza-járvány kitörését. Ismertesse az esetleges hibákat az egyes rendszerekben.
  3. [ kemény , kódolást igényel , adatgyűjtés ] A The Economist egy heti hírportál. Hozz létre egy emberi számítási projektet, hogy megnézze, hogy a nők és a férfiak aránya a fedélen idővel megváltozott-e.

    1. A magazin nyolc különböző régióban (Afrika, Ázsia, Csendes-óceáni, Európa, Európai Unió, Latin-Amerika, Közel-Kelet, Észak-Amerika és Egyesült Királyság) különböző kiterjedésű, és mindegyik letölthető a magazin honlapjáról. Válasszon egyet ezek közül a régiók közül, és végezze el az elemzést. Ügyeljen arra, hogy leírja az eljárásait annyi részletet, hogy valaki mást képesek megismételni.

    Ezt a kérdést Justin Tenuto, a CrowdFlower nevű crowdsourcing cég adatgyűjtőjének hasonló projektje inspirálta: lásd: "Time Magazine Really Like Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ nagyon nehéz , kódolást igényel , adatgyűjtés ] Az előző kérdésre építve most végezze el az elemzést mind a nyolc régió számára.

    1. Milyen különbségek vannak a régiók között?
    2. Mennyi extra időt és pénzt vett igénybe ahhoz, hogy az elemzést mind a nyolc régióra kiterjessze?
    3. Képzelje el, hogy az Economist hetente 100 különféle takarót tartalmaz. Becsülje meg, hogy mennyi idő és pénz szükséges az analízis 100-as borítóhoz hetente történő növelése érdekében.
  5. [ kemény , kódolást igényel ] Számos olyan weboldal működik, amely fogadja a nyílt hívások projektjeit, például a Kaggle-ot. Vegyen részt ezen projektek egyikében, és írja le, mit tanulnak az adott projektről és általában a nyílt hívásokról.

  6. [ közepes ] Nézze át egy új folyóirat adott témáját. Vannak olyan iratok, amelyeket nyílt pályázati projektekként lehetne átfogalmazni? Miért vagy miért nem?

  7. [ könnyen ] Purdam (2014) leír egy megosztott adatgyűjtést a koldulásról Londonban. Összefoglalja e kutatási terv erősségeit és gyengeségeit.

  8. [ közepes ] A redundancia fontos módja annak, hogy értékeljük az elosztott adatgyűjtés minőségét. Windt and Humphreys (2016) kifejlesztett és tesztelt egy olyan rendszert, amely a konfliktus eseményekről szóló beszámolókat gyűjtötte el Kelet-Kongóban élő emberektől. Olvassa el a papírt.

    1. Hogyan biztosítják a tervezésük a redundanciát?
    2. Számos megközelítést kínáltak a projektjükből összegyűjtött adatok érvényesítéséhez. Összefoglaljuk őket. Melyik volt a legmeggyőzőbb?
    3. Javasoljon egy új módszert, amelyen az adatok érvényesíthetők. A javaslatoknak arra kell törekedniük, hogy növeljék a bizalmat az adatokban költséghatékony és etikus módon.
  9. [ közepes ] Karim Lakhani és munkatársai (2013) nyílt hívást indítottak arra, hogy új algoritmusokat kérjenek a számítástechnikai biológia problémájának megoldására. Több mint 600 beadványt kaptak, amelyek 89 új számítógépes megközelítést tartalmaztak. A beadványok közül 30 meghaladta az Amerikai Országos Egészségügyi Intézetek MegaBLAST teljesítményét, és a legjobb benyújtás nagyobb pontosságot és gyorsaságot ért el (1000-szer gyorsabb).

    1. Olvassa el papírját, majd javasoljon egy olyan társadalmi kutatási problémát, amely ugyanazt a nyílt versenyt használhatja. Ez a fajta nyitott verseny elsősorban egy meglévő algoritmus teljesítményének felgyorsítására és javítására irányul. Ha nem gondolhatsz egy ilyen problémára a meződben, próbáld meg elmagyarázni, miért nem.
  10. [ közepes , a kedvencem ] Számos emberi számítási projekt az Amazon Mechanical Turk résztvevőire támaszkodik. Jelentkezzen be az Amazon Mechanical Turk dolgozójává. Töltsön egy órát dolgozni ott. Hogyan hat ez a gondolataid az emberi számítási projektek tervezésére, minőségére és etikájára?