activitats

  • grau de dificultat: fàcil fàcil , mitjà mitjà , dur dur , molt dur molt dur
  • requereix matemàtiques ( requereix matemàtiques )
  • requereix la codificació ( requereix codificació )
  • recopilació de dades ( recopilació de dades )
  • els meus favorits ( el meu preferit )
  1. [ molt dur , requereix codificació , recopilació de dades , el meu preferit ] Una de les afirmacions més emocionants de la recerca de Benoit i els seus col·legues (2016) sobre la multitud de codificació dels manifestos polítics és que els resultats són reproduïbles. Merz, Regel, and Lewandowski (2016) proporcionen accés al Manifest Corpus. Intenta reproduir la figura 2 de Benoit et al. (2016) utilitzant treballadors d'Amazon Mechanical Turk. Quins semblants van ser els resultats?

  2. [ mitjà ] En el projecte InfluenzaNet, un grup de persones voluntàries informa sobre la incidència, la prevalença i el comportament de recerca relacionada amb la malaltia relacionada amb la influença (Tilston et al. 2010; Noort et al. 2015) .

    1. Compareu i contrasteu el disseny, els costos i els possibles errors en InfluenzaNet, Google Flu Trends i els sistemes tradicionals de seguiment de la grip.
    2. Considereu un temps inestable, com un brot d'una forma nova de grip. Descriu els possibles errors de cada sistema.
  3. [ dur , requereix codificació , recopilació de dades ] The Economist és una revista setmanal setmanal. Creeu un projecte de computació humana per veure si la proporció de dones a homes a la portada ha canviat amb el temps.

    1. La revista pot tenir diferents cobertes en vuit regions diferents (Àfrica, Àsia Pacífic, Europa, Unió Europea, Amèrica Llatina, Orient Mitjà, Amèrica del Nord i Regne Unit) i totes es poden descarregar des del lloc web de la revista. Trieu una d'aquestes regions i feu l'anàlisi. Assegureu-vos de descriure els vostres procediments amb un detall suficient perquè algú altre pugui replicar.

    Aquesta pregunta va estar inspirada en un projecte similar de Justin Tenuto, científic de dades a la companyia crowdsourcing CrowdFlower: vegeu "La revista Time Really Likes Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ molt dur , requereix codificació , recopilació de dades ] Basant-se en la pregunta anterior, ara realitzeu l'anàlisi per a les vuit regions.

    1. Quines diferències heu trobat a les regions?
    2. Quant més temps i diners es necessitava per ampliar la seva anàlisi a les vuit de les regions?
    3. Imagineu que l' economista té 100 cobertures diferents cada setmana. Calcular quant temps i diners extra trigaria a augmentar la seva anàlisi a 100 portades a la setmana.
  5. [ dur , requereix codificació ] Hi ha diversos llocs web que allotgen projectes de convocatòria oberta, com ara Kaggle. Participa en un d'aquests projectes i descriu el que aprèn sobre aquest projecte en particular i sobre les trucades obertes en general.

  6. [ mitjà ] Busqueu un número recent d'una revista en el vostre camp. Hi ha documents que s'hagin pogut reformular com a projectes de convocatòria oberta? Per què o per què no?

  7. [ fàcil ] Purdam (2014) descriu una col · lecció de dades distribuïda sobre la mendicitat a Londres. Resumir els punts forts i febles d'aquest disseny d'investigació.

  8. [ mitjà ] La redundància és una forma important d'avaluar la qualitat de la recopilació de dades distribuïda. Windt and Humphreys (2016) desenvolupar i provar un sistema per recollir informes d'esdeveniments de conflictes de persones del Congo oriental. Llegir el document.

    1. Com es garanteix el seu disseny la redundància?
    2. Ofereixen diversos enfocaments per validar les dades recollides del seu projecte. Resumir-los. Quin va ser el més convincent?
    3. Proposa una nova manera de validar les dades. Les suggeriments haurien d'intentar augmentar la confiança que tindria en les dades de manera rendible i ètica.
  9. [ mitjà ] Karim Lakhani i col·legues (2013) crear una convocatòria oberta per sol·licitar nous algoritmes per resoldre un problema en biologia computacional. Van rebre més de 600 presentacions que contenien 89 nous enfocaments computacionals. De les comunicacions, 30 van superar el rendiment de MegaBLAST dels Instituts Nacionals de Salut dels Estats Units, i la millor presentació va aconseguir una major precisió i velocitat (1.000 vegades més ràpida).

    1. Llegeix el seu treball i proposa un problema de recerca social que pugui utilitzar el mateix tipus de concurs obert. En concret, aquest tipus de concurs obert està enfocat a accelerar i millorar el rendiment d'un algoritme existent. Si no podeu pensar en un problema com aquest al camp, intenteu explicar per què no.
  10. [ mitjà , el meu preferit ] Molts projectes de còmput humans es basen en participants de Amazon Mechanical Turk. Inscriu-te per convertir-te en treballador de Amazon Mechanical Turk. Passa una hora treballant allà. Com afecta això els teus pensaments sobre el disseny, la qualitat i l'ètica dels projectes de computació humana?