активности

 • степен на тежина: лесно лесно , средно медиум , тешко тешко , многу тешко многу тешко
 • бара математика ( бара математика )
 • бара кодирање ( бара кодирање )
 • собирање на податоци ( собирање на податоци )
 • Мои фаворити ( мојот омилен )
 1. [ многу тешко , бара кодирање , собирање на податоци , мојот омилен ] Една од највозбудливите тврдења од истражувањето на Benoit и колегите (2016) за толкување на кодирање на политички манифести е дека резултатите се репродуцираат. Merz, Regel, and Lewandowski (2016) обезбедува пристап до Манифестот Корпус. Обидете се да ја репродуцирате сликата 2 од Benoit et al. (2016) со користење на работници од Амазонски механички Турчин. Колку биле слични вашите резултати?

 2. [ медиум ] Во проектот InfluenzaNet, волонтерскиот панел на луѓе ја пријавува инциденцата, преваленцата и однесувањето кон здравјето кое се однесува на болести слични на грип (Tilston et al. 2010; Noort et al. 2015) .

  1. Споредба и контраст на дизајнот, трошоците и можните грешки во InfluenzaNet, Гугл Грип трендови и традиционалните системи за следење на грип.
  2. Размислете за неизвесно време, како што е појава на нова форма на грип. Опишете ги можните грешки во секој систем.
 3. [ тешко , бара кодирање , собирање на податоци ] Економист е неделно списание за вести. Направете проект за човечки пресметки за да видите дали односот на жените со мажи на насловната страна е променет со текот на времето.

  1. Списанието може да има различни опфати во осум различни региони (Африка, Азија Пацифик, Европа, Европска Унија, Латинска Америка, Среден Исток, Северна Америка и Обединетото Кралство) и сите тие може да се симнат од веб-страницата на списанието. Изберете еден од овие региони и извршете ја анализата. Бидете сигурни да ги опишете вашите постапки со доволно детали што би можеле да бидат реплицирани од некој друг.

  Ова прашање беше инспирирано од сличен проект од Џастин Тенуто, научник за податоци во компанијата CrowdFlower: "Списанието за вистински сака дами" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

 4. [ многу тешко , бара кодирање , собирање на податоци ] Градење на претходното прашање, сега изврши анализа за сите осум региони.

  1. Какви разлики сте ги сретнале во регионите?
  2. Колку дополнително време и пари го земаа за да ги зголемат вашите анализи за сите осум региони?
  3. Замислете дека Економист има 100 различни опфаќа секоја недела. Проценете колку дополнително време и пари ќе ги преземе за да ја зголемите вашата анализа до 100 опфаќа неделно.
 5. [ тешко , бара кодирање ] Постојат неколку веб-страници кои ги отвораат проектите за отворен повик, како што е Kaggle. Учествувајте во еден од тие проекти и опишете што научиле за тој конкретен проект и за отворените повици воопшто.

 6. [ медиум ] Погледнете низ неодамнешното издание на списанието во вашето поле. Дали има документи кои би можеле да бидат преформулирани како проекти за отворен повик? Зошто да или зошто не?

 7. [ лесно ] Purdam (2014) опишува дистрибуирана збирка на податоци за молат во Лондон. Резимираме предностите и слабостите на овој истражувачки проект.

 8. [ медиум ] Вишок е важен начин да се процени квалитетот на дистрибуираните податоци. Windt and Humphreys (2016) разви и тестира систем за собирање на извештаи за конфликтни настани од луѓе во Источен Конго. Прочитајте ја хартијата.

  1. Како нивниот дизајн обезбедува вишок?
  2. Тие понудија неколку пристапи за потврдување на податоците собрани од нивниот проект. Сумирај ги. Кој ви беше најубедлив?
  3. Предложете нов начин на кој податоците може да се потврдат. Предлозите треба да се обидат да ја зголемат довербата што ќе ја имате во податоците на начин кој е економичен и етички.
 9. [ медиум ] Карим Лакхани и неговите колеги (2013) создадоа отворен повик за барање нови алгоритми за решавање на проблемот во компјутерската биологија. Тие добија повеќе од 600 поднесоци кои содржеа 89 нови пресметковни пристапи. Од поднесоците, 30 ги надминаа перформансите на MegaBLAST на американските национални институти за здравство, а најдобрата поднесување постигна и поголема точност и брзина (1.000 пати побрзо).

  1. Прочитајте го својот труд, а потоа предложите социјален проблем за истражување кој би можел да користи ист вид на отворен натпревар. Особено, овој вид на отворен натпревар е фокусиран на забрзување и подобрување на изведбата на постоечки алгоритам. Ако не можете да помислите на ваков проблем во вашето поле, обидете се да објасните зошто да не.
 10. [ медиум , мојот омилен ] Многу проекти за човечки пресметки се потпираат на учесници од Амазонски механички Турчин. Пријавете се за да станете работник на Амазонски механички Турчин. Поминат еден час работат таму. Како ова влијае на вашите мисли за дизајнот, квалитетот и етиката на проектите за човечки пресметки?