Діяльності

Умовні позначення:

  • Ступінь складності: легкий легко , середній середа , жорсткий жорсткий , дуже важкий дуже важкий
  • вимагає математику ( вимагає математику )
  • вимагає кодування ( вимагає кодування )
  • збір даних ( збір даних )
  1. [ дуже важкий , вимагає кодування , збір даних ] Одним з найбільш захоплюючих претензій з боку Benoit et al. (2015) і Benoit et al. (2015) на натовпи кодування політичних маніфестів є те , що результати є відтвореними. Merz, Regel, and Lewandowski (2016) забезпечує доступ до маніфесту корпус. Спробуйте відтворити рис 2 з Benoit et al. (2015) і Benoit et al. (2015) з допомогою робочих з Amazon Механічний турок. Як схожі були ваші результати?

  2. [ середа ] У проекті InfluenzaNet добровольцем панель людей повідомляють про захворюваності, поширеності та здоров'я шукає поведінки , пов'язаних з грипоподібних захворюваннях (ГПЗ) (Tilston et al. 2010; Noort et al. 2015) і (Tilston et al. 2010; Noort et al. 2015) і (Tilston et al. 2010; Noort et al. 2015) .

    1. Порівняйте і дизайн, вартість і можливі помилки в InfluenzaNet, Google Flu Trends, а також традиційні системи стеження за грипом.
    2. Розглянемо невирішеного час, наприклад, спалахи свинячого грипу. Опишіть можливі помилки в кожній системі.
  3. [ жорсткий , вимагає кодування , збір даних ] The Economist є щотижневий журнал новин. Створити людський проект обчислення, щоб побачити, якщо відношення жінок до чоловіків на кришці збільшилася з плином часу.

    1. Журнал може мати різні покриття в восьми різних регіонах (Африка, Азія Тихоокеанського регіону, Європи, Європейського Союзу, Латинської Америки, Близького Сходу, Північної Америки, і Сполучене Королівство) , і всі вони можуть бути завантажені з сайту The Economist . Виберіть один з цих регіонів і провести аналіз. Обов'язково опишіть ваші процедури досить докладно, щоб вони могли бути відтворений кимось іншим.

    Це питання було натхненний аналогічний проект , Джастін Tenuto, вчений даних на краудсорсингу компанії CrowdFlower см "Time Magazine дійсно любить Dudes" .

  4. [ дуже важкий , вимагає кодування , збір даних ] Спираючись на поставлене вище питання, тепер виконати аналіз для всіх восьми регіонів.

    1. Які відмінності ви знайшли в різних регіонах?
    2. Скільки додаткових грошей і часу знадобилося для розширення масштабів ваш аналіз на всі вісім регіонів?
    3. Уявіть собі, що економіст 100 різних охоплює щотижня. Оцініть, скільки додаткового часу і грошей потрібно, щоб масштабувати свій аналіз до 100 кришок на тиждень.
  5. [ жорсткий , вимагає кодування ] [Kaggle] (https://www.kaggle.com/) є веб-сайт на якому розміщені проекти відкритих викликів. Візьміть участь в одному з цих проектів.

  6. [ середа ] Подивитися недавньому випуску журналу в своїй області. Чи існують які-небудь документи, які могли б перефразувати проекти відкритих викликів? Чому або чому ні?

  7. [ легко ] Purdam (2014) описав колекцію розподілених даних про жебрацтва в Лондоні. Узагальнити сильні і слабкі сторони цього дослідницького проекту.

  8. [ середа ] Надмірність є важливим засобом для оцінки якості розподіленого збору даних. Windt and Humphreys (2016) розробити і протестувати систему для збору повідомлень про конфліктні подій від людей в Східному Конго. Прочитайте документ.

    1. Як їх конструкція забезпечують надмірність?
    2. Вони пропонують кілька підходів для перевірки достовірності даних, отриманих від їх проекту. Узагальнити їх. Що було найпереконливішим для вас?
    3. Запропоновано новий спосіб, яким дані можуть бути підтверджені. Пропозиції повинні спробувати збільшити впевненість, що ви мали б в даних таким чином, що є економічно ефективним і етичним.
  9. [ середа ] Карім Лакхані і його колеги (2013) створили відкритий виклик запитувати нові алгоритми для вирішення завдання в області обчислювальної біології. Вони отримали більше 600 подань, що містять 89 нові обчислювальні підходи. З представлених матеріалів, вони отримали 30, що перевищило показники США Національних інститутів охорони здоров'я Megablast, і краще представлення досягається як велику точність і швидкість (в 1000 разів швидше).

    1. Прочитайте їх папір, а потім запропонувати соціальну проблему досліджень, які могли б використовувати той же самий вид відкритого конкурсу. Зокрема, цей вид відкритого конкурсу орієнтована на прискорення і підвищення ефективності існуючого алгоритму. Якщо ви не можете думати про проблему, як це в вашій області, спробуйте пояснити, чому немає.
  10. [ середа ] Багато проектів обчислень людини покладаються на учасників з Amazon Механічний турок. Увійдіть в систему, щоб стати робочим на Amazon Механічний турок. Проведіть одну годину роботи там. Як це вплине на ваші думки з приводу дизайну, якості та етики проектів compuation людини?