дзейнасць

Ўмоўныя абазначэнні:

  • Ступень складанасці: лёгкі лёгка , сярэдні серада , жорсткі жорсткі , Вельмі цяжка вельмі цяжка
  • патрабуе матэматыку ( патрабуе матэматыку )
  • патрабуе кадавання ( патрабуе кадавання )
  • збор дадзеных ( збор дадзеных )
  1. [ вельмі цяжка , патрабуе кадавання , збор дадзеных ] Адным з самых захапляльных прэтэнзій з боку Benoit et al. (2015) і Benoit et al. (2015) на натоўпу кадавання палітычных маніфэстаў з'яўляецца тое , што вынікі з'яўляюцца прайграваных. Merz, Regel, and Lewandowski (2016) забяспечвае доступ да маніфесту корпус. Паспрабуйце прайграць мал 2 з Benoit et al. (2015) і Benoit et al. (2015) з дапамогай рабочых з Amazon Механічны турак. Як падобныя былі вашы вынікі?

  2. [ серада ] У праекце InfluenzaNet добраахвотнікам панэль людзей паведамляюць аб захворваннi, распаўсюджанасці і здароўя шукае паводзін , звязаных з грыпападобных захворваннях (ГПЗ) (Tilston et al. 2010; Noort et al. 2015) і (Tilston et al. 2010; Noort et al. 2015) і (Tilston et al. 2010; Noort et al. 2015) .

    1. Параўнайце і дызайн, кошт і магчымыя памылкі ў InfluenzaNet, Google Flu Trends, а таксама традыцыйныя сістэмы сачэння за грыпам.
    2. Разгледзім нявырашанага час, напрыклад, ўспышкі свінога грыпу. Апішыце магчымыя памылкі ў кожнай сістэме.
  3. [ жорсткі , патрабуе кадавання , збор дадзеных ] The Economist з'яўляецца штотыднёвы часопіс навін. Стварыць чалавечы праект вылічэнні, каб убачыць, калі стаўленне жанчын да мужчын на вечку павялічылася з цягам часу.

    1. Часопіс можа мець розныя пакрыцця ў васьмі розных рэгіёнах (Афрыка, Азія Ціхаакіянскага рэгіёну, Еўропы, Еўрапейскага Саюза, Лацінскай Амерыкі, Блізкага Ўсходу, Паўночнай Амерыкі, і Злучанае Каралеўства) , і ўсе яны могуць быць загружаны з сайта The Economist . Абярыце адзін з гэтых рэгіёнаў і правесці аналіз. Абавязкова апішыце вашыя працэдуры досыць падрабязна, каб яны маглі быць прайграны кімсьці іншым.

    Гэтае пытанне быў натхнёны аналагічны праект , Джасцін Tenuto, вучоны дадзеных на краудсорсинга кампаніі CrowdFlower см "Time Magazine сапраўды любіць Dudes" .

  4. [ вельмі цяжка , патрабуе кадавання , збор дадзеных ] Абапіраючыся на пастаўленае вышэй пытанне, цяпер выканаць аналіз для ўсіх васьмі рэгіёнаў.

    1. Якія адрозненні вы знайшлі ў розных рэгіёнах?
    2. Колькі дадатковых грошай і часу спатрэбілася для пашырэння маштабаў ваш аналіз на ўсе восем рэгіёнаў?
    3. Уявіце сабе, што эканаміст 100 розных ахоплівае кожны тыдзень. Ацаніце, колькі дадатковага часу і грошай спатрэбіцца, каб маштабаваць свой аналіз да 100 вечкаў на тыдзень.
  5. [ жорсткі , патрабуе кадавання ] [Kaggle] (https://www.kaggle.com/) з'яўляецца вэб-сайт на якім размешчаны праекты адкрытых выклікаў. Прыміце ўдзел у адным з гэтых праектаў.

  6. [ серада ] Паглядзець нядаўнім выпуску часопіса ў сваёй галіне. Ці існуюць якія-небудзь дакументы, якія маглі б перафразаваць праекты адкрытых выклікаў? Чаму або чаму няма?

  7. [ лёгка ] Purdam (2014) апісаў калекцыю размеркаваных дадзеных аб кленчанне ў Лондане. Абагульніць моцныя і слабыя бакі гэтага даследчага праекта.

  8. [ серада ] Надмернасць з'яўляецца важным сродкам для ацэнкі якасці размеркаванага збору дадзеных. Windt and Humphreys (2016) распрацаваць і пратэставаць сістэму для збору паведамленняў аб канфліктных падзей ад людзей ва Усходнім Конга. Прачытайце дакумент.

    1. Як іх канструкцыя забяспечваюць надмернасць?
    2. Яны прапануюць некалькі падыходаў для праверкі дакладнасці дадзеных, атрыманых ад іх праекта. Абагульніць іх. Што было найбольш пераканаў для вас?
    3. Прапанаваны новы спосаб, якім дадзеныя могуць быць пацверджаны. Прапановы павінны паспрабаваць павялічыць упэўненасць, што вы мелі б у дадзеных такім чынам, што з'яўляецца эканамічна эфектыўным і этычным.
  9. [ серада ] Карым Лакхани і яго калегі (2013) стварылі адкрыты выклік запытваць новыя алгарытмы для вырашэння задачы ў галіне вылічальнай біялогіі. Яны атрымалі больш за 600 уяўленняў, якія змяшчаюць 89 новыя вылічальныя падыходы. З прадстаўленых матэрыялаў, яны атрымалі 30, што перавысіла паказчыкі ЗША Нацыянальных інстытутаў аховы здароўя Megablast, і лепшае ўяўленне дасягаецца як вялікую дакладнасць і хуткасць (у 1000 разоў хутчэй).

    1. Прачытайце іх паперу, а затым прапанаваць сацыяльную праблему даследаванняў, якія маглі б выкарыстоўваць той жа самы выгляд адкрытага конкурсу. У прыватнасці, гэты від адкрытага конкурсу арыентавана на паскарэнне і павышэнне эфектыўнасці існуючага алгарытму. Калі вы не можаце думаць аб праблеме, як гэта ў вашай вобласці, паспрабуйце растлумачыць, чаму не.
  10. [ серада ] Многія праекты вылічэнняў чалавека належаць на ўдзельнікаў з Amazon Механічны турак. Ўвайдзіце ў сістэму, каб стаць рабочым на Amazon Механічны турак. Правядзіце гадзіну працы там. Як гэта паўплывае на вашыя думкі з нагоды дызайну, якасці і этыкі праектаў compuation чалавека?