shughuli

  • shahada ya ugumu: rahisi rahisi , kati kati , ngumu ngumu , ngumu sana ngumu sana
  • inahitaji math ( inahitaji math )
  • inahitaji coding ( inahitaji coding )
  • ukusanyaji wa data ( ukusanyaji wa data )
  • favorites yangu ( mimi favorite )
  1. [ ngumu sana , inahitaji coding , ukusanyaji wa data , mimi favorite ] Moja ya madai ya kusisimua zaidi kutoka kwa Benoit na wafanyakazi wenzake (2016) kuhusu uchunguzi wa watu wa manifesto za kisiasa ni kwamba matokeo yanayozalishwa. Merz, Regel, and Lewandowski (2016) hutoa upatikanaji wa Manifesto Corpus. Jaribu kuzaliana sura ya 2 kutoka Benoit et al. (2016) kutumia wafanyakazi kutoka Amazon Mechanical Turk. Vipi matokeo yako yalikuwa sawa?

  2. [ kati ] Katika mradi wa InfluenzaNet jopo la kujitolea la watu linaripoti matukio, maambukizi, na tabia ya kutafuta afya inayohusiana na ugonjwa wa mafua ya mafua (Tilston et al. 2010; Noort et al. 2015) .

    1. Linganisha na kulinganisha makosa ya kubuni, gharama, na uwezekano katika InfluenzaNet, Mwelekeo wa Fluji za Google, na mifumo ya kufuatilia ya mafua ya jadi.
    2. Fikiria wakati usio na wakati, kama vile kuzuka kwa fomu ya riwaya. Eleza makosa iwezekanavyo katika kila mfumo.
  3. [ ngumu , inahitaji coding , ukusanyaji wa data ] Economist ni gazeti la kila wiki. Unda mradi wa hesabu ya binadamu ili kuona kama uwiano wa wanawake kwa wanaume kwenye kifuniko umebadilika kwa muda.

    1. Magazeti inaweza kuwa na vifuniko tofauti katika mikoa nane tofauti (Afrika, Asia Pacific, Ulaya, Umoja wa Ulaya, Amerika ya Kusini, Mashariki ya Kati, Amerika ya Kaskazini, na Uingereza) na wote wanaweza kupakuliwa kwenye tovuti ya gazeti hilo. Chagua mojawapo ya mikoa hii na ufanye uchambuzi. Hakikisha kuelezea taratibu zako na maelezo ya kutosha ambayo yanaweza kuigwa na mtu mwingine.

    Swali hili limeongozwa na mradi huo na Justin Tenuto, mwanasayansi wa data katika kampuni ya CrowdFlower ya makundi ya watu: ona "Magazine Magazine Inapenda Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ ngumu sana , inahitaji coding , ukusanyaji wa data ] Jenga swali la awali, sasa fanya uchambuzi kwa mikoa yote nane.

    1. Ulipata tofauti gani katika mikoa?
    2. Ni kiasi gani cha ziada na pesa ambazo zinachukua ili kuongeza uchambuzi wako kwa mikoa yote nane?
    3. Fikiria kwamba Economist ina vifungo 100 tofauti kila wiki. Tathmini kiasi gani cha ziada na pesa gani itachukua ili kuongeza uchambuzi wako kwa vifuniko 100 kwa wiki.
  5. [ ngumu , inahitaji coding ] Kuna tovuti kadhaa ambazo zinaishi miradi ya kufungua, kama vile Kaggle. Kushiriki katika moja ya miradi hiyo, na kuelezea yale unayojifunza kuhusu mradi huo na kuhusu wito wazi kwa ujumla.

  6. [ kati ] Angalia kwa suala la hivi karibuni la jarida katika shamba lako. Je! Kuna majarida yoyote ambayo yanaweza kubadilishwa kama miradi ya simu ya wazi? Kwa nini au kwa nini?

  7. [ rahisi ] Purdam (2014) inaelezea kusambazwa kwa data kuhusu kuombea London. Soma nguvu na udhaifu wa kubuni hii ya utafiti.

  8. [ kati Redundancy ni njia muhimu ya kutathmini ubora wa kukusanya data. Windt and Humphreys (2016) walijenga na kupima mfumo wa kukusanya taarifa za matukio ya migogoro kutoka kwa watu wa Mashariki mwa Kongo. Soma karatasi.

    1. Je! Kubuni yao inahakikishaje uharibifu?
    2. Walipa mbinu kadhaa za kuthibitisha data zilizokusanywa kutoka kwa mradi wao. Wafupishe. Ni ipi iliyokuwa yenye kukushawishi?
    3. Pendekeza njia mpya ambayo data inaweza kuthibitishwa. Mapendekezo yanapaswa kujaribu kuongeza ujasiri kwamba utakuwa na data kwa njia inayofaa na yenye maadili.
  9. [ kati ] Karim Lakhani na wafanyakazi wenzake (2013) walitoa wito wa wazi wa kuomba algorithms mpya ili kutatua tatizo katika biolojia ya kompyuta. Wao walipokea maoni zaidi ya 600 yanayohusu mbinu 89 za riwaya za kompyuta. Katika mawasilisho, 30 ilizidi utendaji wa MegaBLAST ya Taasisi za Afya za Marekani za Marekani, na kuwasilisha bora kufanikiwa kwa usahihi zaidi na kasi (mara 1,000 kwa kasi).

    1. Soma karatasi yao, na kisha kupendekeza tatizo la utafiti wa kijamii ambalo linaweza kutumia aina moja ya mashindano ya wazi. Hasa, aina hii ya mashindano ya wazi inazingatia kasi na kuboresha utendaji wa algorithm iliyopo. Ikiwa huwezi kufikiria tatizo kama hili katika shamba lako, jaribu kueleza kwa nini si.
  10. [ kati , mimi favorite ] Mradi wengi wa hesabu za binadamu hutegemea washiriki kutoka Amazon Mechanical Turk. Ishara ili uwe mfanyakazi kwenye Kituruki cha Mitambo ya Amazon. Tumia saa moja kufanya kazi huko. Je! Hii inathirije mawazo yako kuhusu kubuni, ubora, na maadili ya miradi ya hesabu ya binadamu?