1.1 Satu hapuskanlah dakwat

Pada musim panas tahun 2009, telefon bimbit berdering di seluruh Rwanda. Sebagai tambahan kepada berjuta-juta panggilan dari keluarga, kawan, dan rakan perniagaan, kira-kira 1,000 Rwanda menerima panggilan daripada Joshua Blumenstock dan rakan-rakannya. Para penyelidik mempelajari kekayaan dan kemiskinan dengan melakukan tinjauan sampel rawak orang dari pangkalan data 1.5 juta pelanggan penyedia telefon bimbit terbesar Rwanda. Blumenstock dan rakan sekerja bertanya kepada orang yang dipilih secara rawak jika mereka mahu mengambil bahagian dalam kaji selidik, menjelaskan sifat penyelidikan kepada mereka, dan kemudian bertanya beberapa soalan tentang ciri demografi, sosial dan ekonomi mereka.

Semua yang saya katakan setakat ini menjadikan bunyi ini seperti kaji selidik sains sosial tradisional. Tetapi apa yang akan datang tidak tradisional-sekurang-kurangnya belum. Sebagai tambahan kepada data tinjauan, Blumenstock dan rakan sekerja juga mempunyai rekod panggilan lengkap untuk semua 1.5 juta orang. Menggabungkan kedua-dua sumber data ini, mereka menggunakan data tinjauan untuk melatih model pembelajaran mesin untuk meramalkan kekayaan seseorang berdasarkan rekod panggilan mereka. Seterusnya, mereka menggunakan model ini untuk menganggarkan kekayaan semua 1.5 juta pelanggan dalam pangkalan data. Mereka juga menganggarkan tempat kediaman semua 1.5 juta pelanggan menggunakan maklumat geografi yang tertanam dalam rekod panggilan. Meletakkan semua ini bersama-sama dengan kekayaan yang dianggarkan dan anggaran tempat kediaman-mereka dapat menghasilkan peta resolusi tinggi mengenai pengedaran kekayaan geografi di Rwanda. Khususnya, mereka dapat menghasilkan kekayaan yang dianggarkan untuk setiap 2,148 sel Rwanda, unit pentadbiran terkecil di negara ini.

Malangnya, adalah mustahil untuk mengesahkan ketepatan anggaran ini kerana tiada siapa yang pernah menghasilkan anggaran untuk kawasan geografi kecil di Rwanda. Tetapi ketika Blumenstock dan rakan-rakan mengagregatkan anggaran mereka ke 30 daerah Rwanda, mereka mendapati bahawa anggaran mereka sangat mirip dengan anggaran dari Survei Demografi dan Kesihatan, yang secara luas dianggap sebagai standar tinjauan emas di negara-negara berkembang. Meskipun kedua pendekatan ini menghasilkan perkiraan serupa dalam hal ini, pendekatan Blumenstock dan rekannya adalah sekitar 10 kali lebih cepat dan 50 kali lebih murah daripada Survei Demografi dan Kesehatan tradisional. Ini secara dramatik lebih cepat dan anggaran kos yang lebih rendah mewujudkan kemungkinan baru untuk penyelidik, kerajaan, dan syarikat (Blumenstock, Cadamuro, and On 2015) .

Kajian ini adalah seperti ujian inkblot Rorschach: apa yang orang lihat bergantung pada latar belakang mereka. Ramai saintis sosial melihat alat ukuran baru yang boleh digunakan untuk menguji teori tentang pembangunan ekonomi. Ramai saintis data melihat masalah pembelajaran mesin baru yang sejuk. Banyak orang perniagaan melihat pendekatan berkuasa untuk membuka kunci nilai dalam data besar yang telah mereka kumpulkan. Banyak penyokong privasi melihat peringatan menakutkan bahawa kita hidup dalam masa pengawasan massa. Dan akhirnya, banyak pembuat dasar melihat cara teknologi baru dapat membantu mewujudkan dunia yang lebih baik. Malah, kajian ini adalah semua perkara itu, dan kerana ia mempunyai campuran ciri-ciri ini, saya melihatnya sebagai tingkap ke masa depan penyelidikan sosial.