1.1 Satu hapuskanlah dakwat

Pada musim panas tahun 2009, telefon bimbit telah dering di seluruh Rwanda. Selain daripada berjuta-juta panggilan antara keluarga, rakan-rakan, dan rakan perniagaan, kira-kira 1,000 rakyat Rwanda menerima panggilan daripada Joshua Blumenstock dan rakan-rakannya. Para penyelidik sedang menuntut kekayaan dan kemiskinan dengan menjalankan kajian orang-orang yang telah disampel secara rawak daripada pangkalan data sebanyak 1.5 juta pelanggan daripada pembekal telefon mudah alih terbesar Rwanda. Blumenstock dan rakan-rakan bertanya kepada peserta jika mereka mahu mengambil bahagian dalam kaji selidik, menjelaskan dasar penyelidikan kepada mereka, dan kemudian bertanya beberapa soalan mengenai ciri-ciri demografi, sosial, dan ekonomi mereka.

Semua yang saya telah berkata sehingga kini membuat bunyi ini seperti kajian sains sosial tradisional. Tetapi, apa yang akan datang bukan tradisional, sekurang-kurangnya belum lagi. Mereka menggunakan data kajian untuk melatih model pembelajaran mesin untuk meramalkan kekayaan seseorang dari data panggilan mereka, dan kemudian mereka menggunakan model ini untuk menganggarkan kekayaan semua 1.5 juta pelanggan. Seterusnya, mereka menganggarkan tempat kediaman semua 1.5 juta pelanggan dengan menggunakan maklumat geografi tertanam dalam log panggilan. Meletakkan kedua-dua anggaran bersama-kekayaan yang dianggarkan dan tempat anggaran kediaman-Blumenstock dan rakan-rakan dapat menghasilkan anggaran resolusi tinggi taburan geografi kekayaan merentasi Rwanda. Khususnya, mereka boleh menghasilkan kekayaan yang dianggarkan bagi setiap 2,148 sel Rwanda, unit pentadbiran yang paling kecil di negara ini.

Ia adalah mustahil untuk mengesahkan anggaran ini kerana tidak ada seorang pun yang pernah dihasilkan anggaran bagi apa-apa kawasan kecil geografi di Rwanda. Tetapi, apabila Blumenstock dan rakan-diagregatkan anggaran mereka kepada 30 daerah Rwanda, mereka mendapati bahawa anggaran mereka adalah sama dengan anggaran dari demografi dan Kajian Kesihatan, piawaian emas dalam kajian di negara-negara membangun. Walaupun kedua-dua pendekatan dihasilkan anggaran sama dalam kes ini, pendekatan Blumenstock dan rakan-rakan adalah kira-kira 10 kali lebih cepat dan 50 kali lebih murah daripada Penyiasatan demografi dan kesihatan tradisional. Anggaran kos secara dramatik lebih cepat dan lebih rendah mewujudkan kemungkinan baru bagi penyelidik, kerajaan, dan syarikat-syarikat (Blumenstock, Cadamuro, and On 2015) .

Selain membangunkan satu kaedah baru, kajian ini adalah jenis seperti ujian inkblot Rorschach; yang orang lihat bergantung kepada latar belakang mereka. Ramai ahli sains sosial melihat alat pengukuran baru yang boleh digunakan untuk menguji teori-teori tentang pembangunan ekonomi. Ramai saintis data melihat masalah pembelajaran mesin baru yang sejuk. Ramai orang perniagaan melihat pendekatan yang kuat untuk membuka kunci nilai dalam data jejak digital yang mereka telah dikumpulkan. Ramai penyokong privasi melihat peringatan menakutkan bahawa kita hidup dalam masa pengawasan besar-besaran. Banyak pembuat dasar melihat satu cara bahawa teknologi baru boleh membantu mewujudkan sebuah dunia yang lebih baik. Malah, kajian ini adalah semua perkara-perkara, dan itulah sebabnya ia adalah tetingkap ke masa depan penyelidikan sosial.