Шарҳи иловагӣ

Дар ин фасли сохта шудааст, ки ҳамчун истинод истифода шавад, на ба сифати тавсифӣ хонда шавад.

  • Муқаддима (боби 2.1)

Яке аз намуди риояи, ки аст, ки дар боби мазкур дохил намешаванд мардумшиносии аст. Барои бештар дар бораи мардумшиносии дар ҷойҳои рақамӣ мебинем Boellstorff et al. (2012) , ва барои бештар дар бораи мардумшиносии дар ҷойҳои рақамӣ ва воқеӣ омехта мебинем Lane (2016) .

  • Маълумот Big (боби 2.2)

Вақте, ки шумо repurposing маълумот, ду хардовар равонӣ, ки метавонад ба шумо кӯмак мекунад, ки мушкилоти имконпазир, ки шумо шояд рӯ ба ақл дармеёбанд. Якум, шумо метавонед тасаввур мажм беҳтарин барои мушкилоти худ ва нисбат ки ба мажм, ки шумо бо истифода. Чӣ гуна аз монанд ҳастанд ва онҳо чӣ тавр фарқ доранд? Агар шумо ҷамъ нест, маълумоти шумо худ ҳастанд, эҳтимол ба фарқи байни он чӣ ки шумо мехоҳед ва он чӣ шумо нест. Аммо, шумо бояд ба қарор, агар ин фарқиятҳои хурд ё калон мешавад.

Дуюм, дар хотир доред, ки касе офарида ва маълумоти шумо барои баъзе сабабҳо ситонида мешавад. Шумо бояд кӯшиш барои фаҳмидани андешаи худ. Ин гуна баръакс-муҳандисӣ метавонад ба шумо кӯмак муайян кардани мушкилоти имконпазир ва Тамоюлҳои дар маълумоти repurposed кунед.

Нест, нест, таърифи ризоияти ягонаи «маълумоти калон", вале бисёре аз мафҳумҳои ба назар мерасад, ки диққатамонро ба 3 Vs: (масалан, њаљм, навъ ва суръат Japec et al. (2015) ). Ба ҷои тамаркуз ба хусусияти маълумоти, таърифи ман бештар дар бораи чӣ маълумот таъсис дода шуд равона шудааст.

дохил Ман маълумоти идораи давлатӣ дар дохили гурӯҳ маълумоти калон аст, як каме ғайримаъмулии. Дигарон, ки дод аз ин ҳолат, аз ҷумла Legewie (2015) , Connelly et al. (2016) , ва Einav and Levin (2014) . Барои маълумоти бештар дар бораи арзиши маълумоти маъмурии давлатӣ барои тадқиқот, нигаред Card et al. (2010) , Taskforce (2012) , ва Grusky, Smeeding, and Snipp (2015) .

Зеро мақсади тадқиқоти маъмурӣ аз даруни низоми омори давлатӣ, махсусан Бюрои барӯйхатгирии ИМА, ниг Jarmin and O'Hara (2016) . Барои табобати дарозии китоби илмӣ сабти маъмурӣ дар омори Шветсия, ниг Wallgren and Wallgren (2007) .

Дар боби, Ман мухтасар пурсиши анъанавӣ ба монанди тадќиќоти кулли иҷтимоӣ (GSS) ба манбаи маълумоти ВАО иҷтимоӣ ба монанди Twitter муқоиса намуданд. Барои муқоиса ҳамаҷониба ва эҳтиёт миёни тадқиқотҳои анъанавӣ ва маълумоти ВАО иҷтимоӣ, ниг Schober et al. (2016) .

  • Тавсифи умумии маълумоти калон (боби 2.3)

Ин 10 хусусиятҳои маълумоти калон дар як қатор роҳҳои гуногун аз ҷониби як қатор муаллифони гуногун шарҳ дода шудааст. Навишта, ки тарзи фикрронии ман дар ин масъалаҳо таъсир бар мегиранд: Lazer et al. (2009) , Groves (2011) , Howison, Wiggins, and Crowston (2011) , boyd and Crawford (2012) , Taylor (2013) , Mayer-Schönberger and Cukier (2013) , Golder and Macy (2014) , Ruths and Pfeffer (2014) , Tufekci (2014) , Sampson and Small (2015) , Lewis (2015) , Lazer (2015) , Horton and Tambe (2015) , Japec et al. (2015) , ва Goldstone and Lupyan (2016) .

Дар тӯли ин боб, ман ба ёдгориҳое рақамӣ замоне, ки ман фикр мекунам нисбатан бетараф аст, истифода бурда мешавад кардам. Боз як истилоҳи маъмул барои нишонаҳои рақамӣ аст асареро рақамӣ (Golder and Macy 2014) , балки ҳамчун HAL Abelson Кен Ledeen ва Гарри Lewis (2008) ишора кард, мӯҳлати бештар мувофиқ аст, шояд ангуштон рақамӣ. Вақте, ки шумо эҷод асареро, шумо чӣ рӯй медиҳад ва асареро, ту нест, метавонад ба таври умум ба шумо бодиққат бошад, шахсан, огоҳ ҳастед. Дар ҳамин рост барои нишонаҳои рақамӣ ту нест. Дар асл, шумо тарк ёдгориҳое, ҳама вақт дар бораи он ки шумо соҳиби дониш хеле кам. Ва, гарчанде ин нишонаҳои Оё номи шумо дар бораи онҳо нест, ки онҳо метавонанд бисёр вақт ба шумо бозгардонда алоќаманд бошад. нонамоён ва шахсан муайян: Ба ибораи дигар, онҳо бештар ба монанди ангуштон мебошанд.

калон

Барои бештар дар бораи чӣ маљмўи калон, вазифаи заношӯиро нисбат санҷишҳои оморӣ мушкилотро, нигаред Lin, Lucas, and Shmueli (2013) ва McFarland and McFarland (2015) . Ин масъалаҳо бояд аз муҳаққиқон боиси таваҷҷӯҳ ба аҳамияти амалии ҷои аҳамияти оморӣ.

Доимо-оид ба

Ҳангоми дида, ҳамеша-оид ба маълумот, он муҳим аст, ки ба баррасии ки оё шумо муқоиса мардум дақиқ ҳамин бо гузашти замон ё ки оё шумо муқоиса баъзе аз гурӯҳи тағйир одамон; Масалан, мебинем, Diaz et al. (2016) .

Non-аксуламаліои

Дар китоби классикӣ оид ба чорањои ғайридавлатӣ аксуламаліои аст Webb et al. (1966) . Намунаҳои дар китоби пеш аз санаи асри технологияи рақамӣ, вале онҳо ҳанӯз ҳам овард. Барои мисол мардуми тағйири рафтори онҳо ба хотири он ки ба ҳузури назорати омма, нигаред Penney (2016) ва Brayne (2014) .

нопурра

Барои бештар дар бораи робитаи сабти, нигаред Dunn (1946) ва Fellegi and Sunter (1969) (таърихӣ) ва Larsen and Winkler (2014) (муосир). Чунин муносибат дошта шудааст, ки дар илми компютер зери номҳои таҳия низ ба монанди deduplication додаҳо, муайян Масалан, номи алоқаманде, ошкор такрор, ва такрор ошкор сабти (Elmagarmid, Ipeirotis, and Verykios 2007) . Ҳамчунин махфият нигоњ равишҳои сабт робитаи, ки оё интиқоли шахсан муайян маълумот талаб намекунад ҳастанд (Schnell 2013) . Facebook низ таҳия кардааст, идома пайванд сабти онњо ба рафтори овоздиҳӣ огоҳ мекунад; Ин арзёбӣ озмоиш, ки ман ба шумо дар бораи дар боби 4 мегӯям шуд (Bond et al. 2012; Jones et al. 2013) .

Барои бештар дар бораи амали сохтмони, ниг Shadish, Cook, and Campbell (2001) , боби 3.

дастнорас

Барои бештар дар бораи AOL debacle Сабти Ҷустуҷӯи, ниг Ohm (2010) . Ман пешниҳод маслиҳат дар бораи шарикӣ бо ширкатҳои ва ҳукуматҳо дар боби 4, вақте ки ман таҷрибаҳо тасвир. Як қатор муаллифони нигаронӣ дар бораи тадқиқоти, ки оид ба маълумоти дастнорас такя изҳори, нигаред ба Huberman (2012) ва boyd and Crawford (2012) .

Як роҳи хуб барои олимон донишгоҳ ба даст дастрас ба маълумот аст, ки ба кор дар як ширкати ҳамчун интерн ё ташрифи муҳаққиқ. Илова ба фароҳам дастрас ба маълумот, ин раванд низ муҳаққиқ маълумоти бештар дар бораи чӣ гуна маълумот, таъсис дода шуд, ки барои таҳлили муҳим аст, кӯмак хоҳад кард.

Non-намояндаи

Non-намояндагии Муассисаҳои мушкилоти асосӣ барои муњаќќиќон ва ҳукуматҳо, ки дӯст доранд, ки изҳороти дар бораи тамоми аҳолӣ мебошад. Ин камтар ташвиш барои ширкатҳое, ки одатан аз рӯи истифодабарандагони онњо нигаронида шудааст. Барои бештар дар бораи чӣ гуна омори Нидерландия масъалаи накардани намояндагии Муассисаҳои бизнеси калон маълумоти мешуморад, нигаред ба Buelens et al. (2014) .

Дар боби 3, ман ба интихоб ва баҳогузорӣ ба таври муфассал ҳам бузургтар тасвир. Ҳатто агар маълумот доранд ғайридавлатӣ намояндагӣ, дар шароити муайян, онҳо метавонанд санҷидашуда барои тавлиди арзёбии хуб.

пайхас

маҳсусан Низоми хеле душвор аст, ки ба бубинед, аз берун. Бо вуҷуди ин, лоиҳа MovieLens (бештар дар боби 4 баррасӣ) шудааст, ки барои беш аз 15 сол аз ҷониби гурӯҳи илмї идора. Аз ин рӯ, онҳо сабт кардаанд ва маълумот дар бораи тарзи системаи дорад, бо мурури замон падидомада ва чӣ тавр муштарак ин таҳлил, то таъсир расонанд (Harper and Konstan 2015) .

Як қатор муҳаққиқони доир маҳсусан дар Twitter тамаркуз намояд: Liu, Kliman-Silver, and Mislove (2014) ва Tufekci (2014) .

Algorithmically дар ҳайрат

Ман аввал шунидам, ки истилоҳи "algorithmically ҳайрат» аз ҷониби Jon Kleinberg дар нутқ истифода бурда мешавад. Фикри асосии performativity он аст, ки баъзе аз назарияҳои илмӣ иљтимої »муҳаррики камераҳои нест» мебошанд (Mackenzie 2008) . Ин аст, ки онҳо дар асл ба ҷаҳон ташаккули на танҳо онро сабт кунед.

лойолуд

Маќомоти оморї давлатӣ тоза кардани иттилоот, таҳриркунӣ маълумоти оморї мехонанд. De Waal, Puts, and Daas (2014) тасвир техникаи таҳриркунӣ маълумотњои оморї тањия барои маълумотњои тадќиќот ва дида бароем, ки андоза онҳо нисбати манбаъњои маълумоти калон, ва Puts, Daas, and Waal (2015) пешниҳод баъзе аз он тарзе, ки барои шунавандагони умумӣ бештар.

Зеро баъзе аз намунаҳои омӯзиши спам дар Twitter, равона Clark et al. (2016) ва Chu et al. (2012) . Дар охир, Subrahmanian et al. (2016) натиҷаҳои DARPA Twitter Bot даъвати тасвир мекунад.

ҳассос

Ohm (2015) баррасӣ таҳқиқоти қабл дар фикри маълумоти ҳассос ва санҷиши бисёрсола омили пешниҳод мекунад. Чор омили ӯ пешниҳод шудаанд: эњтимолияти зарар; эњтимолияти зарар; ҳузури муносибатҳои махфї; ва оё хатари инъикос нигарониҳои мажоритарќ.

  • Базиси чиз (боби 2.4.1)

Омӯзиши Farber Русия таксӣ дар Ню-Йорк оид ба омӯзиши пештар асос ёфта буд Camerer et al. (1997) , ки се намунаи роҳати гуногуни сафари коғазӣ шаклҳои варақаҳои-коғаз истифода ронандагон сабт сафари вақт оғоз, вақти анҷоми, ва Роҳкиро истифода бурда мешавад. Ин тадқиқот қабл, ки ронандагон ба назар менамуд мерафт мақсадноки: онҳо дар рӯзҳои он ҷо, муздашонро баландтар буданд, камтар кор кардааст.

Kossinets and Watts (2009) дар бораи пайдоиши homophily дар шабакаҳои иҷтимоӣ равона карда шуд. Бингар, ки Wimmer and Lewis (2010) барои як равиши гуногун ба масъала ҳамон, ки истифода мебарад, маълумот аз Facebook.

Дар кори минбаъда, подшоҳ ва ҳамкорони кардаанд минбаъдаи таҳқиқ сензура онлайн дар Чин (King, Pan, and Roberts 2014; King, Pan, and Roberts 2016) . Зеро муносибати марбут ба андозагирии сензура онлайн дар Чин, ниг Bamman, O'Connor, and Smith (2012) . Барои бештар дар бораи усулњои оморї, мисли яке аз истифода дар King, Pan, and Roberts (2013) , барои ҳисоб кардани эҳсосоти аз Заметки 11 млн, нигаред ба Hopkins and King (2010) . Барои бештар дар бораи омӯзиши назорат, нигаред ба James et al. (2013) (на камтар техникї) ва Hastie, Tibshirani, and Friedman (2009) (техникӣ бештар).

  • Пешгўии (боби 2.4.2)

Пешбинињои як қисми калони саноатӣ илм маълумот аст (Mayer-Schönberger and Cukier 2013; Provost and Fawcett 2013) . Як навъи пешгуии, ки одатан аз тарафи муҳаққиқон анҷом иљтимої мебошанд пешгўии демографї, масалан Raftery et al. (2012) .

Тамоюлҳои зукоми Google буд, аввалин лоиҳа ба истифодаи маълумоти ҷустуҷӯ nowcast пањншавии зуком нест. Дар асл, муҳаққиқон дар Иёлоти Муттаҳидаи Амрико (Polgreen et al. 2008; Ginsberg et al. 2009) ва Шветсия (Hulth, Rydevik, and Linde 2009) пайдо кардаанд, ки шартҳои Ҷустуҷӯи муайян (масалан, «зукоми») пешгӯӣ назорати миллї саломатии ањолї маълумот пеш аз он озод карда шуд. Баъдан бисёр лоиҳаҳои зиёди дигар мекӯшанд, ки ба истифодаи маълумоти микроэлементхо рақамӣ барои ошкор назорати беморї, нигаред Althouse et al. (2015) , барои баррасии.

Илова ба истифодаи маълумоти микроэлементхо рақамӣ барои пешгӯии натиҷаҳои тандурустӣ, он ҷо низ ҳаҷми бузурги кор бо истифода аз маълумоти Twitter барои пешгӯии натиҷаҳои интихобот шуда буд; барои баррасї ниг Gayo-Avello (2011) , Gayo-Avello (2013) , Jungherr (2015) (разияллоҳу анҳу. 7), ва Huberty (2015) .

Бо истифода аз маълумоти ҷустуҷӯ пешгӯӣ пањншавии зуком ва истифодаи маълумоти Twitter барои пешгӯии интихобот ҳам намунаи истифодаи баъзе гуна микроэлементхо рақамӣ барои пешгӯии баъзе гуна ҳодиса дар ҷаҳон ҳастанд. шумораи бузурги тадқиқотҳое, ки дорои чунин сохтори умумии нест. Љадвали 2.5 бар мегирад, як чанд мисолҳои дигар.

Љадвали 2.5: рӯйхати қисман таҳқиқоти истифодаи баъзе микроэлементхо рақамӣ барои пешгӯии баъзе чорабинӣ.
микроэлементхо рақамӣ натиҷаи рӯйхат
Twitter Блоки даромади дафтари филмҳо дар Амрико Asur and Huberman (2010)
Ҷустуҷӯ гузоришҳо Фурӯши филмҳо, мусиқӣ, китобҳо ва бозиҳои дар ИМА Goel et al. (2010)
Twitter Dow Jones саноатӣ Миёна (ИМА дар бозори саҳомии) Bollen, Mao, and Zeng (2011)
  • Таҷрибаҳо Approximating (боби 2.4.3)

Дар маҷаллаи PS Илм сиёсӣ дошт симпозиуми маълумотҳои калон, inference алоќаи, ва назарияи расмӣ, ва Clark and Golder (2015) љамъбаст ҳар саҳми. Дар мурофиаи маҷаллаи Академияи миллии илмҳои Иёлоти Муттаҳидаи Амрико оид ба симпозиуми inference алоќаи ва маълумоти бузург дошт, ва Shiffrin (2016) љамъбаст ҳар саҳми.

Дар робита ба таҷрибаҳои табиӣ, Dunning (2012) ба табобати дарозии китоби аъло таъмин менамояд. Барои бештар дар бораи истифодаи Ветнам лоиҳаи лотерея ҳамчун таҷрибаи табии, нигаред Berinsky and Chatfield (2015) . Зеро, равишҳои омӯзиши мошини, ки кӯшиш ба таври худкор кашф таҷрибаҳои табиии дохили манбаъҳои маълумоти калон, нигаред Jensen et al. (2008) ва Sharma, Hofman, and Watts (2015) .

Дар робита бо алоқаманде, ки барои баррасии хушбин, нигаред Stuart (2010) , ва барои баррасии ноумедӣ дид Sekhon (2009) . Барои бештар дар бораи мувофиқати ҳамчун як навъ Буридани, нигаред Ho et al. (2007) . Зеро, ки китобҳои таъмин табобат аъло аз алоқаманде, нигаред Rosenbaum (2002) , Rosenbaum (2009) , Morgan and Winship (2014) , ва Imbens and Rubin (2015) .