atividades

Chave:

  • grau de dificuldade: fácil fácil , médio médio , difícil difícil , muito difícil muito difícil
  • requer matemática ( requer matemática )
  • requer codificação ( requer codificação )
  • coleção de dados ( coleção de dados )
  1. [ muito difícil , requer codificação , coleção de dados ] Uma das reivindicações mais emocionantes de Benoit et al. (2015) na crowd-codificação dos manifestos políticos é que os resultados são reprodutíveis. Merz, Regel, and Lewandowski (2016) fornece acesso ao Manifesto Corpus. Tente reproduzir Fig 2 de Benoit et al. (2015) utilizando os trabalhadores da Amazon Mechanical Turk. Como semelhante foram os seus resultados?

  2. [ médio ] No projeto InfluenzaNet um painel voluntário de pessoas relatam a incidência, prevalência e comportamento de busca de saúde relacionada com a gripe do tipo gripal (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. Comparar e contrastar o projeto, custos e erros prováveis ​​em InfluenzaNet, o Google Flu Trends, e sistemas de rastreamento de gripe tradicionais.
    2. Considere um tempo instável, como o surto de gripe suína. Descrever os possíveis erros em cada sistema.
  3. [ difícil , requer codificação , coleção de dados ] The Economist é uma revista semanal de notícias. Criar um projeto de computação humana para ver se a proporção de mulheres para homens na capa tem aumentado ao longo do tempo.

    1. A revista pode ter diferentes coberturas em oito regiões diferentes (África, Ásia-Pacífico, Europa, União Europeia, América Latina, Oriente Médio, América do Norte e Reino Unido) e todos eles podem ser baixados do site do The Economist . Escolha uma destas regiões e realizar a análise. Certifique-se de descrever seus procedimentos com detalhes suficientes que pudessem ser replicados por outra pessoa.

    Esta questão foi inspirado em um projeto semelhante por Justin Tenuto, um cientista de dados na empresa crowdsourcing CrowdFlower , consulte "Time Magazine realmente gosta Dudes" .

  4. [ muito difícil , requer codificação , coleção de dados ] Com base na pergunta acima, agora realizar a análise para todas as oito regiões.

    1. Que diferenças você encontrou entre as regiões?
    2. Quanto a mais tempo e dinheiro que demorou para expandir o seu análise de todos os oito regiões?
    3. Imagine que a Economist tem 100 capas diferentes a cada semana. Estimar quanto tempo e dinheiro que seria necessário para dimensionar-se a sua análise de 100 tampas por semana.
  5. [ difícil , requer codificação ] [Kaggle] (https://www.kaggle.com/) é um site que hospeda projetos de chamadas abertas. Participar de um desses projetos.

  6. [ médio ] Olhe através de uma edição recente de uma revista em seu campo. Há quaisquer documentos que poderiam ter sido reformuladas como projectos de chamadas abertas? Por que ou por que não?

  7. [ fácil ] Purdam (2014) descreveu uma coleta de dados distribuídos sobre mendicância em Londres. Resumir os pontos fortes e fracos deste projeto de pesquisa.

  8. [ médio ] A redundância é uma forma importante para avaliar a qualidade da coleta de dados distribuídos. Windt and Humphreys (2016) desenvolver e testar um sistema para coletar relatórios de eventos de conflito de pessoas no leste do Congo. Leia o papel.

    1. Como é que o seu desenho garantir redundância?
    2. Eles oferecem várias abordagens para validar os dados recolhidos a partir de seu projeto. Resumi-los. Que foi mais convincente para você?
    3. Propor uma nova forma que os dados poderiam ser validado. As sugestões devem tentar aumentar a confiança de que você teria nos dados de uma forma que é rentável e ético.
  9. [ médio ] Karim Lakhani e seus colegas (2013) criou uma chamada aberta para solicitar novos algoritmos para resolver um problema em biologia computacional. Eles receberam mais de 600 apresentações contendo 89 novas abordagens computacionais. Das apresentações, eles receberam 30 que superou o desempenho dos Institutos Nacionais de Megablast da Saúde, ea melhor apresentação alcançado tanto maior precisão e velocidade (1.000 vezes mais rápido).

    1. Leia o seu papel e, em seguida, propor um problema de pesquisa social que poderia usar o mesmo tipo de concurso aberto. Em particular, este tipo de concurso aberto está focada em acelerar e melhorar o desempenho de um algoritmo existente. Se você não pode pensar em problema como este em seu campo, tentar explicar por que não.
  10. [ médio ] Muitos projetos de computação humana contar com participantes de Amazon Mechanical Turk. Inscreva-se para se tornar um trabalhador na Amazon Mechanical Turk. Passar uma hora de trabalho lá. Qual o impacto seus pensamentos sobre o design, qualidade e ética de projectos compuation humanos?