Çalakî

Qûfle:

  • pileya zehmetî: hêsan e sivik , navîn medya , zehmet hişk , Pir dijwar pir dijwar
  • pêwîstî bi fizîkê ( pêwîstî bi fen )
  • pêwîstî bi kar binî ( pêwîstî bi kar binî )
  • berhevkirina daneyên ( berhevkirina daneyên )
  • favorites min ( favorite min )
  1. [ medya , favorite min ] Çirr Algorithmic pirsgirêk bi Trends Flu Google bû. Xwendin di rojnameya bi Lazer et al. (2014) , û nivîsandina kurt de, email zelal ji bo muhendis li Google de, bi mijara pirsgirêka û sihik an fikra çawa pirsgirêkê çareser bikî.

  2. [ medya ] Bollen, Mao, and Zeng (2011) dibêje ku welat ji Twitter dikarin bên bikaranîn ku texmîn di borsayê de. Ev netîce ji bo çêkirina a fona spekulatîf-Derwent Capital Markets-bi razemenî li bazara borsayê de li ser bingeha daneyên ji Twitter birin (Jordan 2010) . Çi delîlên ê ku tu dixwazî ​​pereyan razîne te li ku fona bibînin?

  3. [ sivik ] Gava ku hin parêzvanên tendurustiya gel, zîpik e-cixare wek alîkarî bi bandor ji bo kêşana çixarê, yên din li ser xeterên, wek bilind-astên nîkotîn hişyar bike. Bifikirin ku lêkolîner biryar ji bo lêkolînên raya giştî ber bi e-cixare bi komkirina e-cixare-related posts Twitter û meşandina analîzên hesa.

    1. sê meylekê gengaz e ku hûn herî pir li ser di vê xebatê de bi endîşe ne, çi ne?
    2. Clark et al. (2016) tenê bi vî rengî xebatê de bezî. Yekem, ew 850,000 tweets ku Related keywords-e-cixare ji January 2012 bi rêya December 2014. Piştî herhalî, bi kar komkirin, wan fêm kir ku gelek ji van dardakirin automated bûn (ango, bi destê mirovan hatiye çêkirin ne) û gelek ji van dardakirin automated di bingeh de bûn kecen. Ew bi pêş Algorithm a Detection Mirovan ji hev cûda dardakirin, otomat ku ji dardakirin organîk. Bi bikaranîna vê Mirovan Tesbîtkirina Algorithm ew dît ku ji% 80 ji dardakirin automated bûn. Gelo ev netîce biguhere bersiva te ji part (a)?
    3. Dema ku ew bi hesta li dardakirin, organîk û automated bihêt dîtin ku wê ew dardakirin, otomat ku ji dardakirin organîk (6.17 li dijî 5.84) erênî zêdetir in. Gelo ev netîce biguhere bersiva we bo (b)?
  4. [ sivik ] Di çiriya paşîn 2009, Twitter, pirsa ku di qutiya tweet ji "Hûn çi dikin?" Guherî "çi diqewime?" (Https://blog.twitter.com/2009/whats-happening).

    1. Ez çawa dikarim baweriya we, guhertina rengvedaneke tesîrê dê li ku tweet û / an çi ew tweet?
    2. Navê yek projeya bo lêkolînê ji bo ku hûn dê binivîsin tercîh "Hûn çi dikin?" Rave bikin ku çima.
    3. Navê yek projeya bo lêkolînê ji bo ku hûn dê binivîsin tercîh "çi diqewime?" Rave bikin ku çima.
  5. [ medya ] Kwak et al. (2010) , analîza 41.7 milyon profiles user, 1.47 milyar, têkiliyên civakî, 4262 mesajên Trending, û 106 milyon dardakirin, di navbera June 6th û 31'ê Hezîranê, 2009. Li ser bingeha vê analîzê ew encamê ku Twitter xizmetê zêdetir wek haletekî nû ya agahî parve ji tora civakî de.

    1. Ber çavan, ev netîce Kwak et al, bi çi type of lêkolîn dê te bi daneya Twitter çi bikin? Çi cûre lêkolîn dê te bi daneya Twitter çi ne? Çima?
    2. Di sala 2010 de, Twitter added a Kî To Follow xizmeta pêkanîna pêşniyara çareyan ji bo bikarhênerên. Sê pêşniyaran bi di demekê de li ser rûpela sereke li banî tê. Pêşnîyarên bi gelek caran ji yekî xêzkirin "hevalên xwe-ji-heval," û têkiliyên dualî bi jî li havalên xwe nîşan dan. Bikarhêner dikarin refresh ji bo dîtina nuh yên pêşnîyarên an a rûpel bi lîsteya êdî pêşniyarên biçin. Ma hûn guman dikin ku ev taybetiya nû dê bersiva xwe de ji bo beşek biguherîne)? Çima an çima ne?
    3. Su, Sharma, and Goel (2016) bandora kî li pey xizmeta nirxandin û dîtin ku dema bikarhênerên seranserê Panelîst populertiyê ji pêşniyarên sûd, bikarhênerên herî populer bi kêrî bêjî bêtir ji puan e. Gelo ev netîce biguhere bersiva xwe ji bo part b)? Çima an çima ne?
  6. [ sivik ] "Retweets" bi gelek caran ji bo pîvandinê bandora bikaranîn û belav bandora li ser Twitter. Di destpêkê de, bikarhênerên hebû ji bo wê kopî bikî û bi îmêlî vrêkey li tweet wan dixwest, versiyona rast a nivîskar orjînal bi / handle xwe, û bi destan kes: "RT" li ber tweet ji bo nîşan bide ku ev retweet ye. Piştre, di 2009 Twitter added a button "retweet". Di hezîrana 2016, Twitter, mirov ji bo bikarhênerên ji bo retweet dardakirin, xwe bi xwe (https://twitter.com/twitter/status/742749353689780224) çêkirin. Ma hûn guman dikin ku ev guhertin, divê bandorê ku tu çawa bi kar tînin "retweets" Di lêkolîna xwe? Çima an çima ne?

  7. [ medya , berhevkirina daneyên , pêwîstî bi kar binî ] Michel et al. (2011) tên çêkirin, a corpus holê ji hewleke Google ji bo dîjîtalkirina pirtûkan. Bi bikaranîna Versiyon ji bo pêşî ya corpus, ku di sala 2009 de hate weşandin û yên li ser 5 milyon pirtûkên dîjîtal, nivîskarên ji bo lêkolînkirina guherînên zimanî û bêyûm çandî analîz frequency bikaranîna peyva. Di demeke nêzîk de Books Corpus Google çavkaniya welat gel ji bo lêkolînerên bû, û guhertoyeke 2nd ji nav HTMLê da heye di sala 2012 de serbest hat berdan.

    Lê belê, Pechenick, Danforth, and Dodds (2015) hişyar kir ku lêkolîner divê ji bo bi temamî ravekirina pêvajoya mînakan ji corpus berî bikaranîna wê ji bo sûdgirtina encamên berfireh. Ser pirsa sereke ev e, ku corpus pirtûkxaneya-like e, dihewînin, yek ji her pirtûkê de. Di encama çalakiyê de, ya ferdî, nivîskar zengîn karibin hev CDROM'ê komepeyvên me yên nû di nav peyvan Google Books e. Herwiha, nivîsên zanistî an para diçe daîmî yên corpus li seranserê 1900s pêk tînin. Li gel vê, di riya danberheva du versions of the datasets Fiction English, Pechenick et al. delîlên dît ku filtering nebes in çêkirin yekem versiyona hat bikaranîn. Hemû daneyên pêwîst ji bo çalakiyên li vir e: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html

    1. Li Michel et al. Li paper original (2011) , ew bi kar Versiyon ji bo 1'emîn ya set welat English, şêwirîn, bibandor di bikaranîna sal "1880", "1912" û "1973", û wê encamê ku "em ne ji bîr borî me zûtir bi her sal derbas "(Hêjîrê. 3A, Michel et al.). Texlîd a komploya heman bikaranîna 1) version 1'emîn ya corpus, English dataset (eynî wek Hêjîrê. 3A, Michel et al.)
    2. Niha komploya heman bi guhertoya 1st, English fiction dataset texlîd.
    3. Niha komploya heman bi guhertoya 2nd ji corpus, English dataset texlîd.
    4. Di dawiyê de, texlîd komploya heman bi guhertoya 2nd, English fiction dataset.
    5. de wekhevî û di navbera van çar komployên nasîn. Ma tu bi Michel et al. Li şirovekirina eslî yê trend dît li hev dikin? (Hint: c) û d) bila di heman wek Figure 16 li Pechenick et al be).
    6. Niha ku we ev yek zivik werbigirin bikar tînin cuda Google Books Corpora, guhertina zimanî din an jî diyardeyên çandî pêşkeş kirin di rojnameya original Michel et al. Da hilbijêre. Ma tu bi şîrovekirina wan li hev di ronahiyê de ji rêzikên li pêşkêşkirin li Pechenick et al.? Ji bo ku argumana xwe bi hêztir, hewl Eraqê graph heman bikaranîna versiyonên cuda yên welat set wek ku li jor.
  8. [ pir dijwar , berhevkirina daneyên , pêwîstî bi kar binî , favorite min ] Penney (2016) lê dinêre ka xwiyakirina di çapemeniyê de berfireh li ser NSA çavdêriyê / NSA (ango, bi wehîyê Snowden) di hezîrana 2013 de bi kêm tûj û ji nişka ve di trafîkê de ji bo gotarên Wîkîpediya de li ser mijaran e ku zêdekirina fikarên nepeniya têkildarkirin. Heke wisa be, ev guhertina di helwesta wê dê hevgirtî bi bandoreke tirsnak a ku ji çavdêriya girseyî. Nêzîkatiya Penney (2016) e, carna an design series dem qut kir û bi vê helwestên ku di beşa têkildarî approximating tecrûbeyên ji welat observational (Beþ 2.4.3).

    Ji bo hilbijartina keywords topic de, Penney ji lîsteya ji aliyê wezareta parastina nîştimanîya Amerîka ji bo êşekê û şopandina di medya civakî de bi kar tê behskirin. Di lîsteya wê grubê nihêrtin search terms hinek nav li ser mijarên cur, ango "metirsî Health", "Ewlekariya binesazî," û "bi terorê re." Ji bo koma xebatê de, Penney bi kar çil û heşt keywords related to "Terorê re" (Table 8 bibînin Revîyê kor). Ew paşê Wikipedia Arabistana view gotara li ser bingeha mehane ji bo bi têkildarî ya çil û heşt gotarên Wîkîpediya de li ser dema sî-du meha -şandîyên, ji destpêkê ve ji rêbendan 2012 de ji bo di dawîya meha Tebaxê 2014. Ji bo xurtkirina argumana xwe, ew bi xwe jî gelek berhevdana tên afirandin komên ji aliyê êşekê views gotara li ser mijarên din.

    Niha, tu diçî Eraqê û dirêj Penney (2016) . Hemû daneyên raw ku hûn ê ji bo vê çalakiyê divê available ji Wikipedia (https://dumps.wikimedia.org/other/pagecounts-raw/) e. An jî tu dikarî ji wikipediatrend pakêta R get (Meissner and Team 2016) . Gava ku hun-up bersivên te, ji kerema xwe not bikin ku çavkaniya daneyên we de tê bikaranîn. (Têbinî: Ev çalakî di heman jî li Chapter 6 xuya dike)

    1. Read Penney (2016) û texlîd Figure 2 nîşan dide ku views rûpel ji bo "Terorîzmê" Rûpelên -related berî û piştî xuyabûna Snowden. Şiroveyên raveyên.
    2. Next, texlîd Hêjîrê 4A, ku koma xebatê de ( "Terorîzmê" articles -related) himberî bi komeke comparator bikaranîna keywords categorized di bin "grubê & sazîyên din" ji lîsteya wê grubê (Pêvek Table 10 dibînin). Şiroveyên raveyên.
    3. Di part b) tu di nav koma xebatê de bi komeke comparator bihêt. "Binesaziya Ewlekariya" articles -related (Table Pêvek 11) û rûpelên Wîkîpediya popular (Table Pêvek 12): Penney jî ji bo du komên din comparator bihêt. Werin jorê bi komeke comparator alternatîf, û biceribîne, eger qenaetên ji part b) hesas de ji bo hilbijartina xwe ya koma comparator e. Ku hilbijartina koma comparator jî watedar? Çima?
    4. Nivîskarê diyar kir ku keywords di heqê "Terorîzmê" ji bo bijartina gotarên Wîkîpediya de, ji ber ku hikumeta Amerîka terorîzm wek hincet key ji bo pêkanînên kontrola me bike wê behskirî de hatine bikaranîn. Wek check ji van 48 "Terorîzmê" keywords -related, Penney (2016) jî lêkolînê li ser MTurk pişikdaran pirs û serdanêr dikarin li her yek ji keywords di warê Trouble Hikûmeta, Policy-Sensitive, û Xwestirîn kirin (Table 7 Pêvek û 8). Eraqê bin lêkolînê li ser MTurk û miqayese encamên xwe.
    5. Li gorî encamên di part d) û xwendina we ya li ser gotara, ma tu bi tercîha nivîskêr ya keywords topic Di pula xwendinê li hev? Çima an çima ne? Eger ne, we dê çi li şûna pêşniyaz?
  9. [ sivik ] Efrati (2016) rapor, li ser agahîya nehênî, ku "sharing total" on Facebook by ser 5.5% sal li ser salê red kiribû, di dema "sharing weşana original" down% 21 sal li ser salê bû. Ev kêmbûna bi taybetî bi bikarhênerên Facebook di bin temenê 30 salî şûn akût bû. Di raporê de, bitaybet ji bo du vedigere. Yek ku bilindbûna hejmara "dostên" kesên li ser Facebookê ye. Ya din jî ew e ku hin çalakiyên parvekirina hatiye mesajên û ji hevrikên xwe yên wekî Snapchat guhert. Di raporê de çend taktîkên Facebook hewl dabû ji bo zengilê parvekirin, di nav wan de tweaks rêbazeke News Feed ku posts original navdar zêdetir, û herweha ji bîr kovara yên bikarhêneran posts original "Di vê roja" çend sal berê hinartîye. Çi encamên, eger tu, ne ev netîce ji bo lêkolînerên ku dixwazin ji bo bikaranîna Facebook weke çavkaniya welat heye?

  10. [ medya ] Tumasjan et al. (2010) ragihand, ku rêjeya dardakirin, behsa partiyeke siyasî bi rêk û rêjeya dengên ku partî di hilbijartinên parlemanê de German di sala 2009 de qebûl dike (Şikil 2.9). Bi gotineke din, wisa xuya bû ku, tu dikarî Twitter ku pêşbînî li ser hilbijartinê bi kar tînin. Di dema vê lêkolînê de hate weşandin ew gelek bi heyecan hate hesibandin ji ber ku ew xuya bû pêşniyarekê bikaranîna hêja ji bo çavkaniya hevbeş ên data mezin.

    Ji ber taybetmendiyên xerab ên data mezin, lê belê, divê tu di cih de bi gûman ev encam be. Elmanan li ser Twitter di sala 2009 de gelekî koma non-Nûnerê bûn, û alîgirên yek partî bibe li ser siyasetê gelek caran tweet. Bi vî awayî, wisa xuya dike ecêb e ku hemû meylekê mumkin e ku tu bikaribî di xeyala bi awayekî dê betal derket. Di rastiyê de, encamên li Tumasjan et al. (2010) ji bo ku pir baş ji bo rast be. Di rojnameya xwe, Tumasjan et al. (2010) Demokrat (CDU), Christian Sosyal Demokrat (CSU), SPD, Lîberal (FDP), The Çep (Die Linke), û ji Partiya Keskan (Grüne): şeş partiyên siyasî nirxandin. Lê belê, partiya siyasî ya German navborî herî on Twitter di wê demê de Partîya Korsanan (Piraten), partiyeke ku bi Sûriyeya qaîdeyên hikûmetê yên di internêtê de bû. Dema Partîya Korsanan di analîzên di nav de bû, Twitter de behsa nîşaneya xerab ji encamên hilbijartinê dike (Şikil 2.9) dibe (Jungherr, Jürgens, and Schoen 2012) .

    Figure 2.9: Twitter behsa xuya kir ku pêşbînî li encamên 2009 hilbijartinê German (Tumasjan et al 2010)., Di heman demê de ev encam derdikeve ku girêdayî li ser hin tercîhên keyfî û ne heq e (Jungherr, Jürgens, û Schoen 2012).

    Figure 2.9: Twitter behsa xuya kir ku pêşbînî li encamên 2009 hilbijartinê German (Tumasjan et al. 2010) , Di heman demê de ev encam derdikeve ku girêdayî li ser hin tercîhên keyfî û ne heq e (Jungherr, Jürgens, and Schoen 2012) .

    Piştre, lêkolînerên din ên li cîhanê bi kar dişopîne rêbazên-wek bikaranîna analysis, hesek ji ciyawaziya di navbera erênî û neyînî behsa yên partiyên-in ji bo baştirkirina a kapasîteya welat Twitter mirov pêşbînî bike, cîhêreng ên ji cureyên cuda yên hilbijartinên (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) . Li vir çawa Huberty (2015) ku encam ji van hewldanên ji bo pêşbînî hilbijartinên rêz bike:

    "Hemû rêbazên forecasting tê zanîn li ser çapemeniya civakî de bi ser neket dema ji bo daxwazên forecasting rast pêş-digerin di hilbijartinan de kirin. Ev şkestin xuya ye ku ji ber taybetiyên bingehîn ên di medya civakî de, bêtir ji bo zehmetiyên metodolojîk an algorithmic. Bi kurtî, di medya civakî de ne, û dibe qet wê, pêşniyar û mercan de, bêalî, picture nûnerê hilbijardinan; û test rehetîya medya civakî de kêm welat bes ji bo tamîrkirina van pirsgirêkên piştî hoc. "

    Read hin ji yên ku lêkolînên ku rê Huberty (2015) ji bo ku encamê de, û nivîsandina memo yek rûpel ji bo namzetê siyasî danasîna ger û çawa Twitter divê werin bikaranîn ji bo Weather hilbijartinên.

  11. [ medya ] Çi cudahiyê di navbera civaknas û dîrokzan e? Li gor Goldthorpe (1991) , li Cidahiya serekî di navbera civaknas û dîrokzan kontrola li ser berhevkirina daneyên e. Dîroknas bi zorê ji bo bikaranîna wan dikişand, lê belê civaknas dikarin berhevkirina daneyên xwe ji bo armancên taybet pilanekê. Read Goldthorpe (1991) . Çawa Ferqa di navbera sosyolojî û dîroka related heye ku bi fikra ji Custommades û Readymades?

  12. [ hişk ] Avakirina li ser pirsa berê, Goldthorpe (1991) a hejmara bersivên krîtîk de, di nav wan de yek ji Nicky Hart kişand (1994) ku dilsoziya Goldthorpe ya rabûm ji pilanekê Daneyên çêkirin. Ji bo zelalkirina sînorên potansiyel ên data-terzîtî kir, Hart Karkeran Project dewlemend, a lêkolînê mezin ji bo pîvandinê têkiliya di navbera çîna civakî û dengdana ku ji aliyê Goldthorpe û hevalên xwe di nîvê salên 1960î de pêk hat bi nav kirin. Wekî ku yek bibe ji akademîsyenekî ye ku welat li ser daneyên dîtin dîzaynkirin keçika ku hêvî, ji Project Worker dewlemend Daneyên ku ji bo çareserkirina a teoriya pêşniyar di derbarê pêşerojê de ji çîna civakî ya di serdema zêdetir standardên jîyana anegorê hate komkirin. Lê belê, Goldthorpe û hevalên xwe bi awayekî "ji bîr kir" ji bo komkirina agahiyên li ser reftara dengdanê ji jinan. Li vir çawa Nicky Hart (1994) fezleke hemû episode:

    ". . . zehmet [e] da ku wê encamê ku jinan bi hevre bûn, ji ber vê 'terzîtî kir' dataset bi mantiqa paradigmatic ku hiştin ezmûna jin di çarçeweya bû. Driven destê dîtiniyekê de teorîk de jî ji ber hişmendiya class û çalakiya xwe weke xalan male. . . , Goldthorpe û hevalên wî tên çêkirin a set of belge û îdiayên ku têr û pêşmercên teorîk de xwe bi xwe li şûna ku xelekeke wan ji bo testa derbasdar ya rasteqîniyê xweyîkirin. "

    Hart dewam kir:

    "Encamên ampîrîk yên Project Worker dewlemend ji me re bêtir li ser nirxên masculinist civaknasî û nîvê sedsala ew ji wan agahdar bike ku pêvajoya asûna, siyaset û jiyana maddî."

    Gelo hûn ên wergerandî yên din cihê berhevkirina daneyên-terzîtî kir meylekê ji berhevkarên welat ji ava nav ew difikirin? Çawa ev bimînînim çirr algorithmic nayê? Çi encamên wê bibe, ev ji bo dema ku lêkolînerên divê Readymades bi kar tînin hene û gava ku ew divê Custommades bi kar tînin?

  13. [ medya ] Di vê beşê de, ez daneyên di destê lêkolîneran ji bo lêkolîneran bi records îdarî tên afirandin ji aliyê şirketên û hikûmetên paralelî. Hinek mirov ji van qeydên îdarî yên ku ew bi berevajî vê "welat, hate dîtin" "welat hatiye dîzaynkirin." Ev rast e ku records îdarî bi destê lêkolîneran dîtin, lê ew jî bi gelekî dîzaynkirin. Ji bo nimûne, kompaniyên teknolojiya modern derbas mîqdarên mezin ya dem û çavkaniyên ji bo komkirin û curate welat xwe. Bi vî awayî, ev qeydên îdarî bi her du dîtin û dîzaynkirin, ew tenê li ser perspektîfa xwe (WÊNE 2.10) girêdayî ye.

    Figure 2.10: The picture hem duck û kevroşk e; tiştên ku hûn dibînin girêdayî li ser perspektîfa xwe. Û Hikûmeta business records îdarî bi her du dîtin û dîzaynkirin; tiştên ku hûn dibînin girêdayî li ser perspektîfa xwe. Ji bo nimûne, records welat banga komkirin ji aliyê şîrketa telefona berîkê bi daneya ku bi perspektîfa a lêkolînerê dîtin. Lê belê, ev qeydên tam eynî bi perspektîfa welat ji kesekî ku di beşa fatûre ji şîrketa telefonê de hatiye sêwirandin. Source: Li Wikimedia Commons

    Figure 2.10: The picture hem duck û kevroşk e; tiştên ku hûn dibînin girêdayî li ser perspektîfa xwe. Û Hikûmeta business records îdarî bi her du dîtin û dîzaynkirin; tiştên ku hûn dibînin girêdayî li ser perspektîfa xwe. Ji bo nimûne, records welat banga komkirin ji aliyê şîrketa telefona berîkê bi daneya ku bi perspektîfa a lêkolînerê dîtin. Lê belê, ev qeydên tam eynî bi perspektîfa welat ji kesekî ku di beşa fatûre ji şîrketa telefonê de hatiye sêwirandin. Source: Li Wikimedia Commons

    Ne nimûneyeke çavkaniya daneya ku ev dît û hem jî wekî dîtin û dîzaynkirin ku bi bikaranîna ku çavkaniya daneyên ji bo lêkolîn alîkar e.

  14. [ sivik ] Di gotareke bi bal, Christian Sandvig û Eszter Hargittai (2015) nasandina du cureyên lêkolîn dîjîtal, ku sîstema digital "instrument" an e "object ya xebatê de." An nimûne yên bi vî yekê yê lêkolîna li cihê ku Bengtsson û hevalên (2011) bi kar welat telefonên mobîl ji bo wan bişopîne koçberiyê piştî erdheja Haiti li 2010. An nimûne ji cureyê duyem jî ew e ku Jensen (2007) xebatên xwe çawa bi cî kirinê yên telefonên mobile li seranserî Kerala, India jiyîn birêveçûna yên bazarê ji bo masî. bibînin ez vî warî de, ji ber ku zelal dike ku lêkolînên bikaranîna çavkaniyên daneyan dîjîtal dikarin armancên pir cuda, heta eger ew bi kar tînin, bi eynî cûreyê çavkaniya daneya hene. Ji bo zelalkirin zêdetir ev cihêtî, salix çar lêkolînên ku te dîtîye: du ku bikaranîna sîstemeka tivilman wekî enstrumanekî û du ku bikaranîna sîstema digital wek object ya xebatê de. Tu dikarî wergerandî ji vê beşa eger tu dixwazî ​​bi kar tînin.