1.1 Bir mürekkep lekesi

2009 yazında, cep telefonları tüm Ruanda genelinde çalıyordu. Aile, arkadaş ve iş arkadaşlarından gelen milyonlarca çağrıya ek olarak, yaklaşık 1000 Ruanda, Joshua Blumenstock ve meslektaşlarından bir telefon aldı. Bu araştırmacılar, Rwanda'nın en büyük cep telefonu sağlayıcısı olan 1,5 milyon müşteriden oluşan bir veri tabanından rastgele örneklem araştırması yaparak servet ve yoksulluk üzerinde çalışıyorlardı. Blumenstock ve meslektaşları rastgele seçilmiş insanlardan bir araştırmaya katılmak istediklerini sordular, araştırmanın niteliğini onlara anlattılar ve daha sonra demografik, sosyal ve ekonomik özellikleri hakkında bir dizi soru sordular.

Şimdiye kadar söylediğim her şey, bu geleneksel bir sosyal bilim araştırması gibi geliyor. Ama sonra gelenler geleneksel değil — en azından henüz değil. Anket verilerinin yanı sıra, Blumenstock ve meslektaşları da 1,5 milyon kişinin tamamı için çağrı kayıtlarına sahipti. Bu iki veri kaynağını birleştirerek, arama kayıtlarını kullanarak kişinin servetini tahmin etmek için bir makine öğrenme modelini eğitmek üzere anket verilerini kullandılar. Ardından, bu modeli veritabanındaki tüm 1,5 milyon müşterinin zenginliğini tahmin etmek için kullandılar. Ayrıca, toplam 1,5 milyon müşterinin ikamet yerlerini arama kayıtlarına yerleştirilmiş coğrafi bilgileri kullanarak tahmin ettiler. Bunların hepsini bir araya getirmek - tahmini zenginlik ve tahmini ikamet yeri - Ruanda'da servetin coğrafi dağılımının yüksek çözünürlüklü haritalarını üretebildiler. Özellikle, Ruanda'nın ülkenin en küçük idari birimi olan 2.148 hücresinin her biri için tahmini bir servet üretebilirler.

Ne yazık ki, bu tahminlerin doğruluğunu onaylamak imkansızdı çünkü hiç kimse Ruanda'daki bu küçük coğrafi bölgeler için hiç tahmin yapmamıştı. Ancak Blumenstock ve meslektaşları tahminlerini Ruanda'nın 30 semtine topladıklarında, tahminlerinin, gelişmekte olan ülkelerdeki araştırmaların altın standardı olarak kabul edilen Demografik ve Sağlık Araştırması tahminlerine çok benzediğini gördüler. Bu iki yaklaşım bu durumda benzer tahminler üretse de, Blumenstock ve meslektaşlarının yaklaşımı yaklaşık 10 kat daha hızlıydı ve geleneksel Demografik ve Sağlık Araştırmaları'ndan 50 kat daha ucuzdu. Bu önemli ölçüde daha hızlı ve daha düşük maliyet tahminleri araştırmacılar, hükümetler ve şirketler için yeni olanaklar yaratmaktadır (Blumenstock, Cadamuro, and On 2015) .

Bu çalışma bir Rorschach mürekkep lekesi testi gibidir: insanların gördükleri arka planlarına bağlıdır. Birçok sosyal bilimci , ekonomik kalkınma hakkındaki teorileri test etmek için kullanılabilecek yeni bir ölçme aracı görüyor. Birçok veri bilimcisi, yeni bir makine öğrenimi problemini görüyor. Birçok iş adamları , topladıkları büyük veride değeri açığa çıkarmak için güçlü bir yaklaşım görüyorlar. Birçok gizlilik savunucusu kitlesel bir gözetim zamanında yaşadığımız korkunç bir hatırlatıcıyı görüyor. Son olarak, birçok politika yapıcı yeni teknolojinin daha iyi bir dünya yaratmaya yardımcı olabileceğini görüyor. Aslında, bu çalışma tüm bu şeylerdir ve bu özellik karışımına sahip olduğu için, onu sosyal araştırmanın geleceğine bir pencere olarak görüyorum.