attività

Chiave:

  • Grado di difficoltà: facile facile , medio medio , difficile difficile , molto difficile molto difficile
  • richiede la matematica ( richiede la matematica )
  • richiede la codifica ( richiede codifica )
  • raccolta dati ( raccolta dati )
  1. [ molto difficile , richiede codifica , raccolta dati ] Una delle affermazioni più interessanti da Benoit et al. (2015) sulla folla-codifica dei manifesti politici è che i risultati sono riproducibili. Merz, Regel, and Lewandowski (2016) fornisce l'accesso al Manifesto Corpus. Provare a riprodurre Fig 2 da Benoit et al. (2015) con i lavoratori da Amazon Mechanical Turk. Come simili sono stati i tuoi risultati?

  2. [ medio ] Nel progetto InfluenzaNet un gruppo volontario di persone relazione l'incidenza, la prevalenza e la salute comportamento di ricerca relative al simil-influenzale-malattia (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. Confrontare e contrapporre la progettazione, i costi e probabili errori di InfluenzaNet, Google Trend influenzali e tradizionali sistemi di monitoraggio dell'influenza.
    2. Considerare un tempo instabile, come l'epidemia di influenza suina. Descrivere i possibili errori in ogni sistema.
  3. [ difficile , richiede codifica , raccolta dati ] The Economist è un magazine settimanale di news. Creare un progetto di calcolo umano per vedere se il rapporto delle donne agli uomini in copertina è aumentata nel corso del tempo.

    1. La rivista può avere diverse copertine in otto diverse regioni (Africa, Asia-Pacifico, Europa, Unione Europea, America Latina, Medio Oriente, America del Nord, e Regno Unito) e tutti possono essere scaricati dal sito di The Economist . Scegliere una di queste regioni ed eseguire l'analisi. Assicurati di descrivere le proprie procedure con dettaglio sufficiente da poter essere replicati da qualcun altro.

    Questa domanda è stata ispirata da un progetto simile da Justin Tenuto, uno scienziato di dati presso la società crowdsourcing CrowdFlower , vedere "Time Magazine piace molto Dudes" .

  4. [ molto difficile , richiede codifica , raccolta dati ] Sulla base della domanda di cui sopra, ora eseguire l'analisi per tutte le otto regioni.

    1. Quali differenze hai trovato tra le regioni?
    2. Quanto più tempo e denaro ci è voluto per scalare-up la vostra analisi a tutte e otto le regioni?
    3. Immaginate che l'Economist ha 100 diverse copertine a settimana. Stimare quanto tempo supplementare e denaro ci vuole per scalare-up la vostra analisi a 100 coperti a settimana.
  5. [ difficile , richiede codifica ] [Kaggle] (https://www.kaggle.com/) è un sito che ospita i progetti invito aperto. Partecipare a uno di questi progetti.

  6. [ medio ] Guardare attraverso un recente numero di una rivista nel vostro campo. Ci sono documenti che avrebbero potuto essere riformulati come progetti open call? Perché o perché no?

  7. [ facile ] Purdam (2014) descrissero una raccolta dati distribuiti su accattonaggio a Londra. Riassumere i punti di forza e di debolezza di questo progetto di ricerca.

  8. [ medio ] La ridondanza è un modo importante per valutare la qualità della raccolta dei dati distribuiti. Windt and Humphreys (2016) sviluppare e testare un sistema per raccogliere segnalazioni di eventi di conflitto da parte di persone nel Congo orientale. Leggi il documento.

    1. In che modo il loro design garantisce la ridondanza?
    2. Essi offrono diversi approcci per convalidare i dati raccolti dal loro progetto. riassumerli. Che era più convincente per te?
    3. Proporre un nuovo modo che i dati potrebbero essere convalidati. Suggerimenti dovrebbero cercare di aumentare la fiducia che si avrebbe nei dati in un modo che è redditizio ed etico.
  9. [ medio ] Karim Lakhani e colleghi (2013) hanno creato un invito aperto per sollecitare nuovi algoritmi per risolvere un problema in biologia computazionale. Hanno ricevuto più di 600 osservazioni contenenti 89 nuovi approcci computazionali. Delle osservazioni, hanno ricevuto 30 che ha superato le prestazioni dei National Institutes of Megablast di salute e la migliore presentazione raggiunte sia una maggiore precisione e velocità (1.000 volte più veloce).

    1. Leggi la loro carta, e poi proporre un problema di ricerca sociale che potrebbe usare lo stesso tipo di concorso aperto. In particolare, questo tipo di concorso aperto è focalizzata sulla accelerare e migliorare le prestazioni di un algoritmo esistente. Se non è possibile pensare a problemi come questo nel tuo campo, cercare di spiegare perché non.
  10. [ medio ] Molti progetti di calcolo umani si affidano a partecipanti provenienti da Amazon Mechanical Turk. Sign-up per diventare un lavoratore su Amazon Mechanical Turk. Trascorrere un'ora di lavoro lì. Come funziona questo impatto i vostri pensieri sul design, la qualità e l'etica dei progetti compuation umani?