Ocupaciones

Llave:

  • grado de dificultad: fácil fácil , media medio , difícil difícil , muy duro muy duro
  • requiere matemáticas ( requiere matemáticas )
  • requiere codificación ( requiere de codificación )
  • recopilación de datos ( recopilación de datos )
  1. [ muy duro , requiere de codificación , recopilación de datos ] Una de las afirmaciones más interesantes de Benoit et al. (2015) en multitud de codificación de manifiestos políticos es que los resultados son reproducibles. Merz, Regel, and Lewandowski (2016) proporciona acceso al Manifiesto Corpus. Tratar de reproducir la figura 2 de Benoit et al. (2015) utilizando trabajadores de Amazon Mechanical Turk. ¿Qué tan similares fueron sus resultados?

  2. [ medio ] En el proyecto InfluenzaNet un panel de voluntarios de las personas informar de la incidencia, la prevalencia y la salud del comportamiento de búsqueda relacionada con la gripe-como-enfermedad (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. Comparar y contrastar el diseño, costos y posibles errores en InfluenzaNet, Google Flu Trends, y sistemas de seguimiento de la gripe tradicionales.
    2. Considere un tiempo sin resolver, tales como el brote de gripe porcina. Describir los posibles errores en cada sistema.
  3. [ difícil , requiere de codificación , recopilación de datos ] The Economist es una revista de noticias semanal. Crear un proyecto de computación humana para ver si la proporción de mujeres y hombres en la portada ha aumentado con el tiempo.

    1. La revista puede tener diferentes cubiertas en ocho regiones diferentes (África, Asia Pacífico, Europa, la Unión Europea, América Latina, Oriente Medio, América del Norte, y del Reino Unido) y todos ellos pueden ser descargados desde el sitio web de The Economist . Elige una de estas regiones y realizar el análisis. Asegúrese de describir sus procedimientos con suficiente detalle para que puedan ser replicados por otra persona.

    Esta pregunta se inspiró en un proyecto similar por Justin Tenuto, un científico de datos de la empresa y Bing para CrowdFlower , ver "la revista Time le gusta mucho Dudes" .

  4. [ muy duro , requiere de codificación , recopilación de datos ] Sobre la base de la pregunta anterior, ahora realizar el análisis de las ocho regiones.

    1. ¿Qué diferencias encuentras entre las regiones?
    2. ¿Cuánto más tiempo y dinero se tarda en aumentar la escala de su análisis para los ocho de las regiones?
    3. Imagínese que el economista tiene 100 portadas diferentes cada semana. Estimar la cantidad de tiempo y dinero extra se necesitaría para aumentar la escala de su análisis para 100 cubiertos por semana.
  5. [ difícil , requiere de codificación ] [Kaggle] (https://www.kaggle.com/) es un sitio web que aloja los proyectos de convocatoria abierta. Participar en uno de esos proyectos.

  6. [ medio ] Mira a través de un número reciente de una revista en su campo. ¿Hay alguna documentos que podrían haber sido reformulados como proyectos de llamadas abiertas? ¿Por qué o por qué no?

  7. [ fácil ] Purdam (2014) describen una colección de datos distribuidos sobre la mendicidad en Londres. Resumir los puntos fuertes y débiles de este diseño de investigación.

  8. [ medio ] La redundancia es una manera importante para evaluar la calidad de la recogida de datos distribuida. Windt and Humphreys (2016) desarrollar y probar un sistema de recogida de informes de eventos de conflicto de personas en el este del Congo. Lee el papel.

    1. ¿Cómo se asegura su diseño redundancia?
    2. Ofrecen varios enfoques para validar los datos recogidos de su proyecto. Resumen de los mismos. Lo que era más convincente para usted?
    3. Proponer una nueva forma de que los datos podrían ser validados. Las sugerencias deben tratar de aumentar la confianza que tendría en los datos de una manera que es rentable y ético.
  9. [ medio ] Karim Lakhani y sus colegas (2013) crearon una convocatoria abierta para solicitar nuevos algoritmos para resolver un problema en la biología computacional. Se recibieron más de 600 presentaciones que contienen 89 nuevos enfoques computacionales. De los escritos, y se recibieron 30 que superó el rendimiento de los Institutos Nacionales de Salud de Estados Unidos de Megablast, y la mejor presentación alcanzan tanto una mayor precisión y velocidad (1.000 veces más rápido).

    1. Leer su papel, y luego proponer un problema de investigación social que podría utilizar el mismo tipo de concurso abierto. En particular, este tipo de concurso abierto se centra en acelerar y mejorar el rendimiento de un algoritmo existente. Si no se puede pensar en un problema como este en su campo, tratar de explicar por qué no.
  10. [ medio ] Muchos proyectos de cálculo humanos dependen de los participantes de Amazon Mechanical Turk. Regístrese para convertirse en un trabajador en Amazon Mechanical Turk. Pasar una hora de trabajo allí. ¿Cómo afecta esto a sus pensamientos sobre el diseño, la calidad y la ética de los proyectos compuation humanos?