дзейнасць

  • Ступень складанасці: лёгкі лёгка , сярэдні серада , жорсткі жорсткі , Вельмі цяжка вельмі цяжка
  • патрабуе матэматыкі ( патрабуе матэматыкі )
  • патрабуе кадавання ( патрабуе кадавання )
  • збор дадзеных ( збор дадзеных )
  • мае любімыя ( мой любімы )
  1. [ вельмі цяжка , патрабуе кадавання , збор дадзеных , мой любімы ] Адзін з самых захапляльных прэтэнзій ад Benoit і яго калегі (2016) даследаванне натоўпу кадавання палітычных маніфэстаў, што вынікі прайграваны. Merz, Regel, and Lewandowski (2016) забяспечвае доступ да Маніфеста корпус. Паспрабуйце прайграць малюнак 2 з Benoit et al. (2016) і Benoit et al. (2016) з дапамогай рабочых з Amazon Mechanical Turk. Як падобныя былі вашы вынікі?

  2. [ серада ] У праекце InfluenzaNet добраахвотнікам панэль людзей паведамляюць аб захворванні, распаўсюджанасці і абыходжання за медыцынскай дапамогай , звязаных з грыпападобных захворванняў (Tilston et al. 2010; Noort et al. 2015) і (Tilston et al. 2010; Noort et al. 2015) і (Tilston et al. 2010; Noort et al. 2015) .

    1. Параўнайце і дызайн, кошт і магчымыя памылкі ў InfluenzaNet, Google Flu Trends, і традыцыйныя сістэмы адсочвання грыпу.
    2. Разгледзім нявырашанага час, напрыклад, ўспышкі новай формы грыпу. Апішыце магчымыя памылкі ў кожнай сістэме.
  3. [ жорсткі , патрабуе кадавання , збор дадзеных ] The Economist з'яўляецца штотыднёвы часопіс навін. Стварыць чалавечы праект вылічэнні, каб убачыць, калі суадносіны жанчын і мужчын на вокладцы змянілася з цягам часу.

    1. Часопіс можа мець розныя пакрыцця ў васьмі розных рэгіёнах (Афрыка, Азіяцка-Ціхаакіянскага рэгіёну, Еўропы, Еўрапейскага Саюза, Лацінскай Амерыкі, Блізкага Ўсходу, Паўночнай Амерыкі, і Злучанае Каралеўства), і ўсе яны могуць быць загружаны з вэб-сайта часопіса. Выбераце адзін з гэтых рэгіёнаў і правесці аналіз. Абавязкова апішыце вашыя працэдуры досыць падрабязна, каб яны маглі быць прайграныя кім-то іншым.

    Гэтае пытанне быў натхнёны аналагічным праектам Джасціна Tenuto, навукоўцы дадзеных на краудсорсинг кампаніі CrowdFlower: глядзіце «Time Magazine сапраўды любіць Dudes» (http://www.crowdflower.com/blog/time-magazine-cover-data) ,

  4. [ вельмі цяжка , патрабуе кадавання , збор дадзеных ] Грунтуючыся на папярэдняе пытанне, у цяперашні час выконвае аналіз для ўсіх васьмі рэгіёнаў.

    1. Якія адрозненні вы знойдзеце ў розных рэгіёнах?
    2. Колькі дадатковы час і грошы гэта брала для пашырэння вашага аналізу для ўсіх васьмі рэгіёнаў?
    3. Уявіце сабе , што эканаміст мае 100 розных пакрыццяў кожны тыдзень. Ацаніце, колькі дадатковага часу і грошай спатрэбіцца, каб пашыраць свой аналіз да 100 чахлоў на тыдзень.
  5. [ жорсткі , патрабуе кадавання ] Ёсць некалькі сайтаў, на якіх размешчаны адкрытыя праекты выкліку, такія як Kaggle. Прыміце ўдзел у адным з гэтых праектаў, і апісаць тое, што вы даведаецеся пра гэта канкрэтным праекце і аб адкрытых выкліках у цэлым.

  6. [ серада ] Паглядзець нядаўні выпуск часопіса ў сваёй галіне. Ці існуюць якія-небудзь дакументы, якія маглі б перафразаваць праекты адкрытых выклікаў? Чаму або чаму няма?

  7. [ лёгка ] Purdam (2014) апісвае набор размеркаваных дадзеных аб кленчанне ў Лондане. Абагульніць моцныя і слабыя бакі гэтага праекта даследаванні.

  8. [ серада ] Надмернасць з'яўляецца важным сродкам для ацэнкі якасці размеркаванага збору дадзеных. Windt and Humphreys (2016) распрацавалі і пратэставалі сістэму для збору паведамленняў аб канфліктных падзеях ад людзей , ва Усходнім Конга. Прачытайце дакумент.

    1. Як іх канструкцыя забяспечвае надмернасць?
    2. Яны прапанавалі некалькі падыходаў для праверкі дакладнасці дадзеных, атрыманых ад іх праекта. Абагульніць іх. Што было самым пераканаўчым для вас?
    3. Прапаноўваць новы спосаб, якім дадзеныя могуць быць пацверджаны. Прапановы павінны паспрабаваць павялічыць упэўненасць, што вы маеце на дадзеных такім чынам, што з'яўляецца эканамічна эфектыўным і этычным.
  9. [ серада ] Карым Lakhani і калегі (2013) стварылі адкрыты выклік запытваць новыя алгарытмы для вырашэння задачы ў галіне вылічальнай біялогіі. Яны атрымалі больш за 600 уяўленняў, якія змяшчаюць 89 новых вылічальных падыходаў. З прадстаўленых матэрыялаў, 30 перавысіў паказчыкі ЗША Нацыянальных інстытутаў аховы здароўя Megablast, і лепшае ўяўленне дасягаецца як вялікую дакладнасць і хуткасць (у 1000 разоў хутчэй).

    1. Прачытайце іх паперу, а затым прапанаваць сацыяльную праблему даследаванняў, якія маглі б выкарыстоўваць той жа самы выгляд адкрытага конкурсу. У прыватнасці, гэты від адкрытага конкурсу арыентавана на паскарэнне і павышэнне эфектыўнасці існуючага алгарытму. Калі вы не можаце думаць аб праблеме, як гэта ў вашай вобласці, паспрабуйце растлумачыць, чаму не.
  10. [ серада , мой любімы ] Многія праекты вылічэнняў чалавека належаць на ўдзельнікаў з Amazon Mechanical Turk. Зарэгіструйцеся, каб стаць рабочым на Amazon Mechanical Turk. Правядзіце гадзіну працы там. Як гэта паўплывае на вашыя думкі з нагоды дызайну, якасці і этыкі праектаў вылічальнымі чалавека?