Ocupaciones

  • grado de dificultad: fácil fácil , medio medio , difícil difícil , muy duro muy duro
  • requiere matemática ( requiere matemática )
  • requiere codificación ( requiere codificación )
  • recopilación de datos ( recopilación de datos )
  • mis favoritos ( mi favorito )
  1. [ muy duro , requiere codificación , recopilación de datos , mi favorito ] Una de las afirmaciones más interesantes de la investigación de Benoit y sus colegas (2016) sobre la codificación colectiva de manifiestos políticos es que los resultados son reproducibles. Merz, Regel, and Lewandowski (2016) brindan acceso al Manifiesto Corpus. Intenta reproducir la figura 2 de Benoit et al. (2016) usando trabajadores de Amazon Mechanical Turk. ¿Qué tan similares fueron tus resultados?

  2. [ medio ] En el proyecto InfluenzaNet, un panel voluntario de personas informa la incidencia, prevalencia y comportamiento de búsqueda de salud relacionado con la enfermedad similar a la influenza (Tilston et al. 2010; Noort et al. 2015) .

    1. Compare y contraste el diseño, los costos y los posibles errores en InfluenzaNet, Google Flu Trends y los sistemas tradicionales de seguimiento de la influenza.
    2. Considere un momento inestable, como un brote de una nueva forma de influenza. Describe los posibles errores en cada sistema.
  3. [ difícil , requiere codificación , recopilación de datos ] The Economist es una revista de noticias semanal. Cree un proyecto de cálculo humano para ver si la relación de mujeres a hombres en la portada ha cambiado con el tiempo.

    1. La revista puede tener diferentes portadas en ocho regiones diferentes (África, Asia Pacífico, Europa, Unión Europea, América Latina, Medio Oriente, Norteamérica y Reino Unido) y todas pueden descargarse desde el sitio web de la revista. Elija una de estas regiones y realice el análisis. Asegúrese de describir sus procedimientos con suficiente detalle para que puedan ser replicados por otra persona.

    Esta pregunta fue inspirada por un proyecto similar de Justin Tenuto, un científico de datos en CrowdFlower, la empresa de crowdsourcing: ver "Time Magazine Really Likes Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ muy duro , requiere codificación , recopilación de datos ] Sobre la base de la pregunta anterior, ahora realice el análisis para las ocho regiones.

    1. ¿Qué diferencias encontraste en las regiones?
    2. ¿Cuánto tiempo y dinero extra se necesitaron para ampliar su análisis a las ocho regiones?
    3. Imagine que The Economist tiene 100 cubiertas diferentes cada semana. Calcule cuánto tiempo extra y dinero tomaría ampliar su análisis a 100 cubiertas por semana.
  5. [ difícil , requiere codificación ] Hay varios sitios web que alojan proyectos de llamada abierta, como Kaggle. Participe en uno de esos proyectos y describa lo que aprende sobre ese proyecto en particular y sobre las llamadas abiertas en general.

  6. [ medio ] Consulte un número reciente de una revista en su campo. ¿Hay documentos que podrían haber sido reformulados como proyectos de convocatoria abierta? ¿Por qué o por qué no?

  7. [ fácil ] Purdam (2014) describe una recopilación de datos distribuidos sobre la mendicidad en Londres. Resuma las fortalezas y debilidades de este diseño de investigación.

  8. [ medio ] La redundancia es una forma importante de evaluar la calidad de la recopilación de datos distribuidos. Windt and Humphreys (2016) desarrollaron y probaron un sistema para recopilar informes de eventos de conflicto de personas en el este del Congo. Lee el papel.

    1. ¿Cómo asegura su diseño la redundancia?
    2. Ofrecieron varios enfoques para validar los datos recopilados de su proyecto. Resumirlos. ¿Qué fue lo más convincente para ti?
    3. Proponer una nueva forma de validar los datos. Las sugerencias deben intentar aumentar la confianza que usted tendrá en los datos de una manera que sea rentable y ética.
  9. [ medio ] Karim Lakhani y sus colegas (2013) crearon una llamada abierta para solicitar nuevos algoritmos para resolver un problema en biología computacional. Recibieron más de 600 presentaciones que contienen 89 nuevos enfoques computacionales. De las presentaciones, 30 excedieron el rendimiento de MegaBLAST de los Institutos Nacionales de Salud de EE. UU., Y la mejor presentación logró mayor precisión y velocidad (1.000 veces más rápido).

    1. Lea su trabajo y luego proponga un problema de investigación social que podría utilizar el mismo tipo de concurso abierto. En particular, este tipo de concurso abierto se centra en acelerar y mejorar el rendimiento de un algoritmo existente. Si no puede pensar en un problema como este en su campo, intente explicar por qué no.
  10. [ medio , mi favorito ] Muchos proyectos de computación humana se basan en participantes de Amazon Mechanical Turk. Regístrese para convertirse en un trabajador en Amazon Mechanical Turk. Pasar una hora trabajando allí. ¿Cómo afecta esto su opinión sobre el diseño, la calidad y la ética de los proyectos de computación humana?