2.2 Big données

Hè cresciute e grandi dati sichi è culligati da i impresi è i guvernatori per altre persone chì ùn anu studiatu Utilizà questa dati per a ricerca, per quessa, esse riurpettendu.

U primu modu chì assai persone ghjunghjenu a ricerca sociale in l'era digitale hè per ciò chì hè spessu chjamatu big data . Malgradu l'usu generalizatu di questu termu, ùn ci hè cunsensu per quale parechji dati hè ancu. In ogni casu, una di e definizzione più cumuni di grande datu si cuncintu à u "3 Vs": Volume, Varietà è Velocità. In più, ci hè molti di dati, in una varietà di formati, è hè stata creata constantemente. Alcuni fanni di grande datu anu aghjuntu ancu altre "Vs" cum'è Veracity è Value, mentri certi critichi aghjunghjenu cum'è Vague è Vacuous. Piuttostu ch'è i 3 "Vs" (o a 5 "Vs" o a 7 "Vs"), per i scopi di a ricerca sociale, crede chì un postu megliu per cumentu hè u 5 "Ws": Quale, Quale, induve Quandu , è perchè In fatti, pensu chì assai di i sfidi è l'oportunità creati da grande stati di dati sanu da una sola "W": Perchè.

In l'età analogica, a maiò parte di e dati chì anu stati usati per a ricerca sociale hè creatu per u scopu di fà a ricerca. In l'era digitale, in ogni modu, una quantità enorma di dati hè statu creatu da l'imprese è i guvernatori per altre persone chì ùn anu studiatu, per esempiu di furnisce i servizii, generatori prufittu è e leie amministrativi. I posti creanu, sin embargo, avete avvistu chì pudete ripusizione l'infurmazione di st'admazione è guvernu per a ricerca. Pensendu à l'analogia artuali in u Chapter 1, cum'è di Duchamp riproggitò un oghjettu truvatu per creà l'arti, i scenziate ponu ripagghiarru solu e dati per creà a ricerca.

Mentre chì ci sò induve maiò enormi opportunità per riurpusà, utilizendu a dati chì ùn sò micca creati per a scopi di a ricerca ancu presente nova sfida. Comparare, per esempiu, un serviziu di suciale media, cum'è Twitter, cun una storia di l'opinioni publica tradiziunali, cum'è l'Encuisazione Soziale Soziale. I buttichi principali di Twitter sò di furnisce un serviziu per i so utilizatori è per fà un profitu. A Cumpagnia Soziale Soziale, da l'altra banda, hè focu annantu à creazione dati generichi di u fini per a ricerca sociale, particularmente per a ricerca di l'opinioni publica. Questa difendenza à l'urdinarii significa chì e dati creati da Twitter è quella creata da a Enistruzione Soziale Genitali sò parechji pruprietà, ancu s'ellu ci sò ancu utilizati per studià l'opinione publica. Twitter opera in una scala è a velocità chì l'Encuista Soziale Geneticu ùn pò micca cunnessione, ma, a versione di l'Enversa Soziale Soziale, Twitter ùn mancu lagoni dilettantemente è ùn viaghja micca dura per mantene a paragunabbilità à u tempu. Perchè sti dui fonti di dati sò cusì sfarenti, ùn hà micca bisognu di dì chì l'Encuista Soziale Soziale hè megliu da Twitter o vice versa. Se vulete mette in ogni misura di l'umore global (per esempiu, Golder and Macy (2011) ), Twitter hè megliu. Invece, quandu vulete intende di i cambiamenti longu in a polarizzazione di l'attitudini in i Stati Uniti (per esempiu, DiMaggio, Evans, and Bryson (1996) ), dopu l'Envertazione Soziale Soziale hè a megliu scelta. In modu più generale, invece di pruvà di discutiri chì e grande fonti di dati sò megliu o pitruli di quelli altre tipu di dati, stu capitulu pruvà à esplicà per quale tipu di dumande di ricerca in quantu prublemi di fonti di dati hannu pruprietà attrattiva è per quale tipi di dumanzii ùn ponu micca esse ideale.

Quandu pensanu à l'infurmazioni di grandi fonti di dati, assai circunchevuli circundà immediatamente nantu à e dati online creati è recullati da e cumpagnie, cum'è questione di u mutore di ricerca è publicità messagi di media. In ogni modu, stu focus focuse falla fora dui altri fonti di grande dati. Prima, e più numerosi fonti di dati di l'infurmazioni grandi venduti venenu da e dispositi digitale in u mondu fisicu Per esempiu, in stu capitulu, vi dicu qualcosa di un studiu chì ripurpondenu l'impresa di supermercatu per studià cusì chì a produtividade di u travagliu hè influinzata da a produtividade di i so parenti (Mas and Moretti 2009) . Dopu, in capulavanu dopu, diceraghju di i circhanti chì anu chjamatu registri di i telefuni mubilii (Blumenstock, Cadamuro, and On 2015) è di e datu di fattura creatu da l'utilità electricità (Allcott 2015) . Quandu l'esemplari illustraranu, e grandi fonti di dati infurmati di l'infurmazioni sò più di più cà cumerci in ligna.

A seconda fonti impurtante di grande dati sappiutu da un focusu apughjatu in u cumpurtamentu online hè a dati creati da i guverni. Questi règuli di guvernu, chì i ricerciaturi anu chjamatu relazioni amministrativi di u guvernu , includenu cose cum'è repertorii di furmazione, scritti di l'istruzzioni è vitae di storia statistica (per esempiu, registri di nascita è morte). I Cunsigliu anu criatu stu tipu di dati per, in certi casi, centu anni, è i scientisti suciali anu avutu sfruttatu per quasi quantu ci sò stati scientisti suciali. Chì hà cambiatu, però, hè a digitalizazione chì hà facilitata per e guadagnani à cullettate, trasmessa, almacenà è analizà e dati. Per esempiu, in stu capitulu, dicu à rigalu nantu à un studiu chì repurposed data di i metri di taxi di u guvernu di novità di u guvernu per trattà un debat fundamentalu à l'economia di u (Farber 2015) . Dopu, in capulavanu dopu, diceraghju di cumu u ricordu di u votu di u guvernu sò usati in una indagazione (Ansolabehere and Hersh 2012) è un pruvimentu (Bond et al. 2012) .

Pensu chì l'idea di riurizazione hè fundamentale per l'appassi di e grande fonti di dati, è cusì, prima di parlà più specificamente di e proprietà di e grandi fonti di dati (sezione 2.3) è cumu si pò esse utilizati à ricerca (sezione 2.4), vogliu di pruponenu dui pezzi di cunsiglii ginirali nantu à ripurizzione. Prima, pò esse tentattivu per pensà à u cuntrastu chì aghju stabilitu com'è trà e dati "truvati" è "creatu". Questu hè vicinu, ma hè micca bè. Ancu s'ellu, da a perspettiva di i circunsidenti, e grandi fonti di dati sò "trovanu", micca cascà da u celu. Invece, i fonti di dati chì sò "trovanu" da i circundatore sò designati da qualcunu per qualchidunu scopu. Perchè "truvatu" l'infurmazioni sò designati da qualchissia, sò sempre cunsigliu chì pruvate à cumprà cum'è nantu à e persone è i prucessi chì creanu i vostri dati. U secondu, quandu si troppu ripurizazione di dati, hè spessu assai utile imaginate u ghjocu di u settore per u vostru prublema è poverete compari l'idee di datu cù l'unu chì site. Se ùn avete micca rimpruverà e vostre dati, ùn ci hè prubabilmente diferenza impurtante entre u vulete è ciò chì avete. Noterete esse diffirenza vi aiutanu à esse di ciò chì pudete è ùn pò micca imparà di a dati chì anu pussutu, è puderia suggerisce i novi dati chì vi puderete cullà.

In a mo spirimintà, i scientifichi suciale è i scientifichi di dati pozzu acchianà di riurpuzioni assai diffirenti. I scientisti suciali, chì sò abituati à travaglià cume di dati imaginati per a ricerca, sò spressa rapidamente per assicurà e prublemi cù e mette repurposed ignurando i so forzi. Per d 'altra banda, i scientifichi di u daveru sò normalizate per assicurà e benefizii di e dati ripurposed ignurando i so punti debbitori. Naturalment, u megliu stimu hè un hybride. Eccu, i circunfacciati anu bisognu di capiscenu i caratteristiche di e grandi fonti di dati, l'omi è di u malu, è scuprite di manera di sapè di elli. È, questu hè u pianu di u restu di stu capitulu. In a secunna secondu, descrierà deci funti cumuni di e grande fonti di dati. Allora, in a secunione dopu, aghju scritte trè avvicinamenti di ricerca chì ponu travaglià bè cù questi dati.