2.3.2 Salawasna-on

Sok-on data gedé nyandak ulikan kajadian kaduga jeung ukuran real-time.

Loba sistem data gedé sok-on; aranjeunna terus ngumpulkeun data. ciri ieu sok di nyadiakeun panalungtik jeung data longitudinal (ie, data dumasar kana waktu). Keur sok-on ngabogaan dua implikasi penting pikeun panalungtikan.

Kahiji, salawasna-on data kempelan nyandak peneliti mun diajar acara terduga dina cara nu teu bakal disebutkeun tiasa. Contona, peneliti museurkeun diajar nu ngeusian protes Gezi di Turki dina usum panas 2013 ilaharna bakal difokuskeun paripolah démonstran nalika acara. Ceren Budak jeung Duncan Watts (2015) éta bisa ngalakukeun leuwih ku ngagunakeun alam salawasna-on of Twitter pikeun diajar démonstran anu dipaké Twitter sateuacan, salila, sarta sanggeus acara. Na, maranéhanana éta bisa nyieun grup ngabandingkeun tina nonparticipants sateuacan, salila, sarta sanggeus éta acara (inohong 2.2). Dina total, panel ex-pos maranéhna kaasup nu tweets tina 30.000 urang leuwih dua taun. Ku augmenting data ilahar dipaké ti protes kalayan informasi séjénna ieu, Budak jeung Watts éta bisa diajar leuwih: maranéhanana éta bisa estimasi naon jinis jalma éta leuwih gampang pikeun ilubiung dina protes Gezi jeung keur estimasi parobahan sikap tina pamilon na nonparticipants, duanana dina istilah pondok (ngabandingkeun pre-Gezi ka mangsa Gezi) jeung dina jangka panjang (ngabandingkeun pre-Gezi kalawan pos-Gezi).

Gambar 2.2: Desain anu digunakeun ku Budak jeung Watts (2015) nepi ka diajar di ngeusian protes Gezi di Turki dina usum panas tina 2013. Ku ngagunakeun alam salawasna-on of Twitter, panalungtik dijieun naon maranéhna disebut panel ex-pos anu kaasup ngeunaan 30.000 urang leuwih dua taun. Kontras jeung ulikan has anu fokus kana peserta salila protes, panel ex-pos nambihan 1) data ti pamilon sateuacan na sanggeus acara jeung 2) data ti nonparticipants sateuacan, salila, sarta sanggeus acara. Struktur data enriched Ieu sangkan Budak jeung Watts keur estimasi naon jinis jalma éta leuwih gampang pikeun ilubiung dina protes Gezi jeung keur estimasi parobahan sikap pamilon sarta non-pamilon, duanana dina istilah pondok (ngabandingkeun pre-Gezi kalawan mangsa Gezi ) jeung dina jangka panjang (ngabandingkeun pre-Gezi kalawan pos-Gezi).

Gambar 2.2: Desain anu digunakeun ku Budak and Watts (2015) nepi ka diajar di ngeusian protes Gezi di Turki dina usum panas tina 2013. Ku ngagunakeun alam salawasna-on of Twitter, panalungtik dijieun naon maranéhna disebut panel ex-pos anu kaasup ngeunaan 30.000 urang leuwih dua taun. Kontras jeung ulikan has anu fokus kana peserta salila protes, panel ex-pos nambihan 1) data ti pamilon sateuacan na sanggeus acara jeung 2) data ti nonparticipants sateuacan, salila, sarta sanggeus acara. Struktur data enriched Ieu sangkan Budak jeung Watts keur estimasi naon jinis jalma éta leuwih gampang pikeun ilubiung dina protes Gezi jeung keur estimasi parobahan sikap pamilon sarta non-pamilon, duanana dina istilah pondok (ngabandingkeun pre-Gezi kalawan mangsa Gezi ) jeung dina jangka panjang (ngabandingkeun pre-Gezi kalawan pos-Gezi).

A skeptic bisa nunjuk kaluar yén sababaraha perkiraan ieu bisa geus dilakukeun tanpa salawasna-on sumber pendataan (misalna perkiraan jangka panjang robah dangong), sarta nu bener, najan misalna kumpulan data pikeun 30.000 urang bakal geus rada mahal. Malah dibere hiji anggaran taya, kumaha oge, abdi teu tiasa mikir sagala metoda sejenna nu dasarna ngamungkinkeun peneliti diperlukeun keur indit deui dina waktos sareng langsung niténan kabiasaan pamilon 'nu geus kaliwat. Alternatif pangdeukeutna bakal ngumpulkeun laporan retrospective tina kabiasaan, tapi laporan ieu bakal jadi sahiji granularity kawates sarta akurasi questionable. tabél 2.1 nyadiakeun conto sejenna studi anu ngagunakeun hiji salawasna-on sumber data pikeun diajar hiji acara kaduga.

Tabél 2.1: Studi ngeunaan acara kaduga make salawasna-on sumber data badag.
acara kaduga Salawasna-on data sumber nyalukan
Ngeusian gerakan Gezi di Turki Twitter Budak and Watts (2015)
protes payung di Hong Kong Weibo Zhang (2016)
Shootings sahiji pulisi di New York City Ngeureunkeun-na-frisk laporan Legewie (2016)
Jalma gabung ISIS Twitter Magdy, Darwish, and Weber (2016)
11 Séptémber 2001 serangan livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 Séptémber 2001 serangan seratan pager Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Salian diajar acara terduga, salawasna-on sistem data badag ogé ngaktipkeun peneliti ngahasilkeun perkiraan real-time, nu tiasa penting dina setélan mana makers-di kawijakan pamaréntah atawa industri-kersa ngawaler dumasar kana kasadaran situasional. Contona, data média sosial bisa dipaké pikeun panduan tanggap darurat bencana alam (Castillo 2016) sarta rupa-rupa sumber data badag béda bisa dipaké ngahasilkeun perkiraan real-time dina aktivitas ekonomi (Choi and Varian 2012) .

Dina kacindekan, salawasna-on data sistem ngaktipkeun peneliti mun diajar acara kaduga jeung nyadiakeun informasi real-time mun makers kawijakan. Kuring mah henteu kitu, pikir nu salawasna-on data sistem anu ogé cocog pikeun parobahan tracking leuwih perioda pisan lila. Yén sabab loba sistem data badag terus ngarobah-prosés éta kuring gé nelepon kumalayang engké dina bab (bagian 2.3.7).