attività

  • grado di difficoltà: facile facile , medio medio , difficile difficile , molto difficile molto difficile
  • richiede matematica ( richiede la matematica )
  • richiede la codifica ( richiede la codifica )
  • raccolta dati ( raccolta dati )
  • i miei preferiti ( il mio preferito )
  1. [ molto difficile , richiede la codifica , raccolta dati , il mio preferito ] Una delle più eccitanti affermazioni della ricerca di Benoit e colleghi (2016) sulla codifica della folla dei manifesti politici è che i risultati sono riproducibili. Merz, Regel, and Lewandowski (2016) forniscono l'accesso al Manifesto Corpus. Prova a riprodurre la figura 2 di Benoit et al. (2016) utilizzando lavoratori di Amazon Mechanical Turk. Quanto sono stati simili i tuoi risultati?

  2. [ medio ] Nel progetto InfluenzaNet un gruppo di volontari di persone riporta l'incidenza, la prevalenza e il comportamento alla ricerca della salute correlati alla malattia simil-influenzale (Tilston et al. 2010; Noort et al. 2015) .

    1. Confronta e contrappone il design, i costi e gli errori probabili in InfluenzaNet, Google Trend influenzali e sistemi di tracciamento dell'influenza tradizionali.
    2. Considera un periodo di instabilità, come un focolaio di una nuova forma di influenza. Descrivi i possibili errori in ogni sistema.
  3. [ difficile , richiede la codifica , raccolta dati ] The Economist è una rivista settimanale. Creare un progetto di calcolo umano per vedere se il rapporto tra donne e uomini in copertina è cambiato nel tempo.

    1. La rivista può avere coperture diverse in otto diverse regioni (Africa, Asia Pacifico, Europa, Unione Europea, America Latina, Medio Oriente, Nord America e Regno Unito) e possono essere scaricate dal sito Web della rivista. Scegli una di queste regioni ed esegui l'analisi. Assicurati di descrivere le tue procedure con abbastanza dettagli da poter essere replicate da qualcun altro.

    Questa domanda è stata ispirata da un progetto simile di Justin Tenuto, uno scienziato di dati della società di crowdsourcing CrowdFlower: vedi "Time Magazine Really Likes Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ molto difficile , richiede la codifica , raccolta dati ] Basandosi sulla domanda precedente, ora esegui l'analisi per tutte e otto le regioni.

    1. Quali differenze hai trovato tra le regioni?
    2. Quanto tempo e denaro extra ci sono voluti per aumentare la tua analisi in tutte e otto le regioni?
    3. Immagina che l' Economist abbia 100 cover diverse ogni settimana. Stima di quanto tempo e denaro extra ci vorrebbe per aumentare la tua analisi fino a 100 cover a settimana.
  5. [ difficile , richiede la codifica ] Esistono diversi siti Web che ospitano progetti di chiamata aperti, come Kaggle. Partecipa a uno di questi progetti e descrivi ciò che apprendi su quel particolare progetto e sulle chiamate aperte in generale.

  6. [ medio ] Guarda un recente numero di un diario nel tuo campo. Ci sono documenti che potrebbero essere stati riformulati come progetti di call aperti? Perché o perché no?

  7. [ facile ] Purdam (2014) descrive una raccolta di dati distribuiti Purdam (2014) a Londra. Riassumi i punti di forza e di debolezza di questo disegno di ricerca.

  8. [ medio ] La ridondanza è un modo importante per valutare la qualità della raccolta di dati distribuiti. Windt and Humphreys (2016) sviluppato e testato un sistema per raccogliere le segnalazioni di eventi di conflitto da parte di persone nel Congo orientale. Leggi il documento.

    1. In che modo il loro design garantisce la ridondanza?
    2. Hanno offerto diversi approcci per convalidare i dati raccolti dal loro progetto. Riassumili. Qual è stato il più convincente per te?
    3. Proponi un nuovo modo di convalidare i dati. I suggerimenti dovrebbero cercare di aumentare la fiducia che si avrebbe nei dati in un modo economicamente conveniente ed etico.
  9. [ medio ] Karim Lakhani e colleghi (2013) creato una chiamata aperta per sollecitare nuovi algoritmi per risolvere un problema nella biologia computazionale. Hanno ricevuto più di 600 contributi contenenti 89 nuovi approcci computazionali. Tra le richieste presentate, 30 hanno superato le prestazioni del MegaBLAST del National Institutes of Health degli Stati Uniti e la migliore presentazione ha ottenuto sia maggiore accuratezza sia maggiore velocità (1.000 volte più veloce).

    1. Leggi il loro articolo e poi proponi un problema di ricerca sociale che potrebbe utilizzare lo stesso tipo di concorso aperto. In particolare, questo tipo di concorso aperto si concentra sull'accelerazione e sul miglioramento delle prestazioni di un algoritmo esistente. Se non riesci a pensare a un problema come questo nel tuo campo, prova a spiegare perché no.
  10. [ medio , il mio preferito ] Molti progetti di computazione umana fanno affidamento sui partecipanti di Amazon Mechanical Turk. Iscriviti per diventare un lavoratore su Amazon Mechanical Turk. Passa un'ora a lavorare lì. In che modo questo influenza le tue opinioni sul design, la qualità e l'etica dei progetti di computazione umana?