мероприятия

  • Степень трудности: легкий легко , средний средний , жесткий жесткий , очень сложно очень сложно
  • требует математики ( требует математики )
  • требует кодирования ( требует кодирования )
  • Сбор данных ( Сбор данных )
  • мои любимые ( мой любимый )
  1. [ очень сложно , требует кодирования , Сбор данных , мой любимый ] Одна из самых захватывающих заявлений из исследования Бенуа и коллег (2016) по толкованию политических манифестов заключается в том, что результаты воспроизводимы. Merz, Regel, and Lewandowski (2016) предоставляют доступ к Манифесту Корпусу. Попробуйте воспроизвести цифру 2 от Benoit et al. (2016) используя работников Amazon Mechanical Turk. Насколько схожи ваши результаты?

  2. [ средний ] В проекте InfluenzaNet группа добровольцев сообщает о распространенности, распространенности и состоянии здоровья, связанных с гриппоподобной болезнью (Tilston et al. 2010; Noort et al. 2015) .

    1. Сравните и сравните дизайн, стоимость и вероятные ошибки в InfluenzaNet, Google Flu Trends и традиционных системах отслеживания гриппа.
    2. Рассмотрим нерегулярное время, такое как вспышка новой формы гриппа. Опишите возможные ошибки в каждой системе.
  3. [ жесткий , требует кодирования , Сбор данных ] The Economist - еженедельный журнал новостей. Создайте проект человеческих вычислений, чтобы увидеть, изменилось ли соотношение женщин и мужчин на обложке с течением времени.

    1. Журнал может иметь разные обложки в восьми разных регионах (Африка, Азиатско-Тихоокеанский регион, Европа, Европейский союз, Латинская Америка, Ближний Восток, Северная Америка и Великобритания), и их можно загрузить с веб-сайта журнала. Выберите один из этих регионов и выполните анализ. Не забудьте описать свои процедуры достаточно подробно, чтобы их можно было воспроизвести кем-то другим.

    Этот вопрос был вдохновлен аналогичным проектом Джастина Тенуто (Justin Tenuto), научного сотрудника в компании краудсорсинга CrowdFlower: см. «Time Magazine Reikes Likes Dudes» (http://www.crowdflower.com/blog/time-magazine-cover-data) ,

  4. [ очень сложно , требует кодирования , Сбор данных ] Основываясь на предыдущем вопросе, теперь проводим анализ для всех восьми регионов.

    1. Какие различия вы обнаружили в разных регионах?
    2. Сколько дополнительного времени и денег потребовалось, чтобы расширить свой анализ во всех восьми регионах?
    3. Представьте себе, что у Economist каждую неделю есть 100 различных обложек. Оцените, сколько дополнительного времени и денег потребуется, чтобы увеличить ваш анализ до 100 обложек в неделю.
  5. [ жесткий , требует кодирования ] Есть несколько веб-сайтов, на которых размещены проекты открытых звонков, такие как Kaggle. Участвуйте в одном из этих проектов и расскажите, что вы узнали об этом конкретном проекте и об открытых вызовах в целом.

  6. [ средний ] Просмотрите недавний выпуск журнала в своей области. Существуют ли какие-либо документы, которые можно было бы переформулировать в качестве проектов с открытыми звонками? Почему или почему нет?

  7. [ легко ] Purdam (2014) описывает распределенный сбор данных о попрошайничестве в Лондоне. Обобщите сильные и слабые стороны этого исследования.

  8. [ средний ] Избыточность - это важный способ оценки качества распределенного сбора данных. Windt and Humphreys (2016) разработали и опробовали систему сбора отчетов о событиях конфликта от людей в Восточном Конго. Читать газету.

    1. Как их дизайн обеспечивает избыточность?
    2. Они предложили несколько подходов к проверке данных, собранных по их проекту. Обобщите их. Что было наиболее убедительно для вас?
    3. Предложите новый способ проверки данных. Предложения должны стараться повысить уверенность в том, что вы будете иметь в данных таким образом, чтобы это было экономически эффективным и этичным.
  9. [ средний ] Карим Лахани и его коллеги (2013) создали открытый призыв запросить новые алгоритмы для решения проблемы вычислительной биологии. Они получили более 600 материалов, содержащих 89 новых вычислительных подходов. Из представленных материалов 30 превысили результаты работы Американских национальных институтов здравоохранения MegaBLAST, и лучшее представление достигло как большей точности, так и скорости (в 1000 раз быстрее).

    1. Прочтите их статью, а затем предложите проблему социальных исследований, которая может использовать такой же открытый конкурс. В частности, такой открытый конкурс ориентирован на ускорение и повышение эффективности существующего алгоритма. Если вы не можете придумать такую ​​проблему в своей области, попробуйте объяснить, почему нет.
  10. [ средний , мой любимый ] Многие проекты человеческих вычислений полагаются на участников из Amazon Mechanical Turk. Зарегистрируйтесь, чтобы стать рабочим на Amazon Mechanical Turk. Проведите там один час работы. Как это влияет на ваши мысли о дизайне, качестве и этике проектов человеческих вычислений?