2.3.2 Sempre da

Sempre-in u grande dati permette à u studiu di iventa inaspettata è misurazzioni dâ vera-tempu.

Tanti sistemi di dati granni sunnu sempri-nant'à; ch'elli sò sempri à cugghiennu dati. Custa calidadi sempre-in u parmette circadori cù data, longitudinal (vale à dì, di dati filu di u tempu). Essa sempri-nant'à hà dui cunseguenze impurtante per a ricerca.

Prima, a ricerca di a ricerca sempre permette à i furmazioni studienti avvenimenti inespettati in manere ch'elli ùn eranu altrimenti pussibule. Per esempiu, studienti interested in studying the Occupy Gezi protesti in Turchia in l'estiu di u 2013 anu da fucalizate nant'à u cumportamentu di i manifestanti duranti l'avvenimentu. Ceren Budak è Duncan Watts (2015) puderanu fà più per l'usu di a natura sempre di Twitter per studià i dimustrati chì anu usatu Twitter prima, duranti è dopu l'avvenimentu. È, puderanu crià un gruppu di comparatione di nonparticipanti prima, duranti è dopu l'avvenimentu (figura 2.2). In u cartulare, u so ex-post panel hà include i tweets di 30.000 parsone di più di dui anni. Aumintannu aduprata aduprata da a prutestà cù questa altra informazioni, Budak è Watts anu capace di sapè assai più: anu capace di calà quale tipi di persone era più propensu di participà à e protezioni di Gezi è per stallà i cambiamenti in attitudini di participanti è nonparticipants, à tempu di pocu tempu (paragunendu a pre-Gezi à durante Gezi) è à longu (per comparar Gezi pre-Gezi cun post-Gezi).

Figura 2.2: Design utilizatu da Budak è Watts (2015) per studià i Occupati Gezi in Turchi in l'estiu di u 2013. Utilizendu a natura sempre di Twitter, i furestieri creanu u chjamonu un panneau ex-postu chì incluse 30.000 parsone in più di dui anni. In contraste cun un studiu tipicu chì centru di i participanti duranti i prutesti, l'ex-post panel agrega 1) dati di i participanti prima è dopu l'avvenimentu è 2) dati da nonparticipants prima, durante è dopu l'avvenimentu. Sta struttura di data richiede hà permessu di Budak è Watts per stima chì tipi di persone era più propensu di participà à e protezioni di Gezi è per stallà i cambiamenti di i attitudini di i participanti è non-participanti, à tempu di pocu tempu (paragunendu a pre-Gezi cù durante Gezi ) è à longu (per parèntesi pre-Gezi cù post-Gezi).

Figura 2.2: Design utilizatu da Budak and Watts (2015) per studià i Occupati Gezi in Turchi in l'estiu di u 2013. Utilizendu a natura sempre di Twitter, i furestieri creanu u chjamonu un panneau ex-postu chì incluse 30.000 parsone in più di dui anni. In contraste cun un studiu tipicu chì centru di i participanti duranti i prutesti, l'ex-post panel agrega 1) dati di i participanti prima è dopu l'avvenimentu è 2) dati da nonparticipants prima, durante è dopu l'avvenimentu. Sta struttura di data richiede hà permessu di Budak è Watts per stima chì tipi di persone era più propensu di participà à e protezioni di Gezi è per stallà i cambiamenti di i attitudini di i participanti è non-participanti, à tempu di pocu tempu (paragunendu a pre-Gezi cù durante Gezi ) è à longu (per parèntesi pre-Gezi cù post-Gezi).

Un scetticu pò esse puntualità chì alcuni di sti stimati puderanu esse statu fattu senza sempre di ricerca di recullazioni di dati (per esempiu, estimazioni longu di u cambiamentu d'attitudine), è questu hè correctu, anche si chì una recopilazione di dati per 30.000 persone seranu abbastanza caru. Ancu secondu un presitu senza limitazione, però, ùn pudemu micca pensate di alcuna manera di mètudu chì essenziale permetterà i ricerchiaturi di ritruvà in u tempu è indirettanu direttament a cumpurtamenta di i participanti in u passatu. L'alternativu più cercano esse di cullà i rapporti retrospetivi di cumpurtamentu, ma queste rapporti anu da esse granularità limitata è una precisione cuestionable. A tavula 2.1 furnisce altre esempi di studii chì utilizanu una fonti di dati sempre per studià un avvene imprevisu.

Tabella 2.1: Studii di avvenimenti inesperu chì utilizanu sempre e dati di grande infurmazioni.
Inesperu avvenimentu Sempre da a fonte di dati Citation
Occupa u Gezi in Turchia Twitter Budak and Watts (2015)
Umbrella protesti in Hong Kong Weibo Zhang (2016)
Disposti di a pulizzia in New York City Reunione di fretu è frisk Legewie (2016)
Persone chì unisci à ISIS Twitter Magdy, Darwish, and Weber (2016)
11 di sittè anniversariu di u 2001 livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 di sittè anniversariu di u 2001 messagi pager Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

In più di studià l'avvenimenti imprevisiunati, i sistemi sempre di grande di dati sianu permettenu ancu chì i circunspenzi di pruduce estimi di tempu, chì ponu esse impurtanti in i paràmetri chì i capulaturi di pulitica-in u guvernu o l'industria volenu risponde basatu à a crescita situational. Per esempiu, e dati di media suciali pò esse usi per guidà a risposta d'emergenza à disastri naturali (Castillo 2016) è una varietà di diverse funti di dati enormi pò esse utilizati pruduce estimi di tempu l'attività ecunomica (Choi and Varian 2012) .

In cunclusioni, sempre-in i sistemi di dati facenu studienti per studià successi inespettati è furnisce infurmazioni in tempu real à i puliticanti. Ùn aghju micca, però, pensanu chì i sistemi di dati chì sò sempre infurmati sò adattati per seguità i cambiamenti nantu à i perdi di assai tempu. Hè perchè chì parechji sistemi di grande datu sò cambiatamenti cambiante-un prucessu chì chjamarà drift più tardi in u capitulu (sezione 2.3.7).