2.3.2 Selalu aktif

Selalu-on data besar memungkinkan studi tentang kejadian tak terduga dan pengukuran real-time.

Banyak sistem data besar selalu-on; mereka terus-menerus mengumpulkan data. Karakteristik ini selalu-on menyediakan peneliti dengan data longitudinal (yaitu, data yang dari waktu ke waktu). Yang selalu-on memiliki dua implikasi penting untuk penelitian.

Pertama, pengumpulan data yang selalu aktif memungkinkan peneliti untuk mempelajari kejadian yang tidak terduga dengan cara yang tidak mungkin dilakukan. Misalnya, para peneliti yang tertarik untuk mempelajari protes Occupy Gezi di Turki pada musim panas 2013 biasanya akan fokus pada perilaku demonstran selama acara tersebut. Ceren Budak dan Duncan Watts (2015) mampu berbuat lebih banyak dengan menggunakan sifat Twitter yang selalu aktif untuk mempelajari pengunjuk rasa yang menggunakan Twitter sebelum, selama, dan setelah acara. Dan, mereka mampu membuat kelompok pembanding nonpartisipan sebelum, selama, dan setelah acara (gambar 2.2). Secara total, panel ex-post mereka termasuk tweets dari 30.000 orang selama dua tahun. Dengan menambah data yang biasa digunakan dari protes dengan informasi lain ini, Budak dan Watts dapat belajar lebih banyak: mereka dapat memperkirakan orang-orang macam apa yang lebih mungkin untuk berpartisipasi dalam protes Gezi dan untuk memperkirakan perubahan dalam sikap peserta dan nonpartisipan, baik dalam jangka pendek (membandingkan pra-Gezi hingga selama Gezi) dan dalam jangka panjang (membandingkan pra-Gezi dengan pasca-Gezi).

Gambar 2.2: Desain yang digunakan oleh Budak dan Watts (2015) untuk mempelajari protes Occupy Gezi di Turki pada musim panas 2013. Dengan menggunakan sifat Twitter yang selalu aktif, para peneliti menciptakan apa yang mereka sebut ex-post panel yang termasuk tentang 30.000 orang selama dua tahun. Berbeda dengan studi khas yang berfokus pada peserta selama protes, panel ex-post menambahkan 1) data dari peserta sebelum dan sesudah acara dan 2) data dari nonpartisipan sebelum, selama, dan setelah acara. Struktur data yang diperkaya ini memungkinkan Budak dan Watt untuk memperkirakan orang-orang seperti apa yang lebih mungkin untuk berpartisipasi dalam protes Gezi dan untuk memperkirakan perubahan dalam sikap peserta dan non-peserta, baik dalam jangka pendek (membandingkan pra-Gezi dengan selama Gezi ) dan dalam jangka panjang (membandingkan pra-Gezi dengan post-Gezi).

Gambar 2.2: Desain yang digunakan oleh Budak and Watts (2015) untuk mempelajari protes Occupy Gezi di Turki pada musim panas 2013. Dengan menggunakan sifat Twitter yang selalu aktif, para peneliti menciptakan apa yang mereka sebut ex-post panel yang termasuk tentang 30.000 orang selama dua tahun. Berbeda dengan studi khas yang berfokus pada peserta selama protes, panel ex-post menambahkan 1) data dari peserta sebelum dan sesudah acara dan 2) data dari nonpartisipan sebelum, selama, dan setelah acara. Struktur data yang diperkaya ini memungkinkan Budak dan Watt untuk memperkirakan orang-orang seperti apa yang lebih mungkin untuk berpartisipasi dalam protes Gezi dan untuk memperkirakan perubahan dalam sikap peserta dan non-peserta, baik dalam jangka pendek (membandingkan pra-Gezi dengan selama Gezi ) dan dalam jangka panjang (membandingkan pra-Gezi dengan post-Gezi).

Seorang yang skeptis mungkin menunjukkan bahwa beberapa perkiraan ini dapat dibuat tanpa sumber pengumpulan data yang selalu ada (misalnya, perkiraan jangka panjang dari perubahan sikap), dan itu benar, meskipun pengumpulan data untuk 30.000 orang akan cukup mahal. Bahkan dengan anggaran yang tidak terbatas, saya tidak dapat memikirkan metode lain yang pada dasarnya memungkinkan peneliti untuk kembali ke masa lalu dan langsung mengamati perilaku peserta di masa lalu. Alternatif yang paling dekat adalah mengumpulkan laporan perilaku retrospektif, tetapi laporan ini akan memiliki perincian terbatas dan akurasi yang dipertanyakan. Tabel 2.1 memberikan contoh lain dari studi yang menggunakan sumber data yang selalu aktif untuk mempelajari kejadian yang tidak terduga.

Tabel 2.1: Studi kejadian tak terduga menggunakan sumber data besar yang selalu ada.
Peristiwa yang tidak terduga Sumber data selalu aktif Kutipan
Menempati gerakan Gezi di Turki Kericau Budak and Watts (2015)
Protes payung di Hong Kong Weibo Zhang (2016)
Penembakan polisi di New York City Laporan berhenti-dan-gesekan Legewie (2016)
Orang yang bergabung dengan ISIS Kericau Magdy, Darwish, and Weber (2016)
Serangan 11 September 2001 livejournal.com Cohn, Mehl, and Pennebaker (2004)
Serangan 11 September 2001 pesan pager Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Selain mempelajari peristiwa yang tidak terduga, sistem data besar yang selalu ada juga memungkinkan peneliti untuk menghasilkan perkiraan waktu nyata, yang dapat menjadi penting dalam pengaturan di mana pembuat kebijakan — di pemerintah atau industri — ingin merespons berdasarkan kesadaran situasional. Sebagai contoh, data media sosial dapat digunakan untuk memandu tanggap darurat terhadap bencana alam (Castillo 2016) dan berbagai sumber data besar yang berbeda dapat digunakan menghasilkan perkiraan real-time dari kegiatan ekonomi (Choi and Varian 2012) .

Kesimpulannya, sistem data yang selalu aktif memungkinkan para peneliti untuk mempelajari peristiwa-peristiwa tak terduga dan memberikan informasi waktu nyata kepada pembuat kebijakan. Namun, saya tidak berpikir bahwa sistem data yang selalu aktif sangat cocok untuk melacak perubahan dalam jangka waktu yang sangat lama. Itu karena banyak sistem data besar yang terus berubah — sebuah proses yang akan saya sebut hanyut nanti di bab ini (bagian 2.3.7).