1.1 Чорнило блот

Влітку 2009 року мобільні телефони дзвонили по всій Руанді. Окрім мільйонів дзвінків від родини, друзів та бізнес-партнерів, близько 1,000 руандийців отримали дзвінок від Джошуа Блуменстока та його колег. Ці дослідники вивчали багатство та бідність, провели опитування випадкової вибірки людей із бази даних 1,5 мільйона клієнтів найбільшого постачальника мобільних телефонів у Руанді. Блюменсток і його колеги попросили випадково відібраних людей, якщо вони хотіли взяти участь у опитуванні, пояснили природу досліджень для них, а потім задавали низку питань про їх демографічні, соціальні та економічні характеристики.

Все, що я вже говорив, робить цей звук подібним до традиційного дослідження соціальних наук. Але те, що відбувається далі, не є традиційним, принаймні, поки що. На додаток до даних опитування, Blumenstock та його колеги також мали повну інформацію про виклики для всіх 1,5 мільйонів людей. Поєднуючи ці два джерела даних, вони використовували дані опитування для підготовки моделі машинного навчання, щоб передбачити багатство людини, спираючись на їх записи викликів. Далі вони використовували цю модель для оцінки багатства всіх 1,5 мільйонів клієнтів у базі даних. Вони також оцінили місця проживання всіх 1,5 мільйонів клієнтів, які використовують географічну інформацію, вбудовану в записи дзвінків. Поставивши все це разом - оціночне багатство та прогнозоване місце проживання - вони змогли отримати карти високої роздільної здатності з географічним розподілом багатства в Руанді. Зокрема, вони могли б забезпечити оцінку багатством для кожного з 1448 камер Руанди, найменшої адміністративної одиниці в країні.

На жаль, неможливо підтвердити точність цих оцінок, оскільки ніхто ніколи не створював оцінки таких невеликих географічних районів у Руанді. Але коли Блюменсток і його колеги склали свої оцінки до 30 районів Руанди, вони виявили, що їхні оцінки дуже схожі на оцінки з демографічного опитування та охорони здоров'я, яке широко вважається золотим стандартом опитування в країнах, що розвиваються. Хоча ці два підходи дали подібні оцінки у цьому випадку, підхід Блюменстока та його колег був приблизно в 10 разів швидшим та в 50 разів дешевшим, ніж традиційні демографічні та медичні огляди. Ці значно швидкіші та менші кошториси витрат створюють нові можливості для дослідників, урядів та компаній (Blumenstock, Cadamuro, and On 2015) .

Це дослідження є таким, як тест на чорнильній картці Rorschach: те, що бачать люди, залежить від їхнього фону. Багато соціологів бачать новий інструмент вимірювання, який можна використовувати для перевірки теорій про економічний розвиток. Багато даних вчені бачать прохолодно нові проблеми машини навчання. Багато ділових людей бачать потужний підхід для розкриття цінності у великих даних, які вони вже зібрали. Багато захисників приватності бачать страшне нагадування, що ми живемо під час масового спостереження. І нарешті, багато політиків сприймають шлях, яким нові технології можуть допомогти створити кращий світ. Фактично, це дослідження - все це, і тому, що у нього є така суміш характеристик, я бачу це як вікно у майбутнє соціальних досліджень.