1.1 Unha mancha de tinta

No verán de 2009, os teléfonos móbiles foron tocando en toda Ruanda. Ademais dos millóns de chamadas entre familiares, amigos e compañeiros de traballo, preto de 1.000 ruandeses recibiu unha chamada de Joshua Blumenstock e os seus colegas. Os investigadores estaban estudando a riqueza ea pobreza a través da realización dunha investigación con persoas que foran mostras aleatoriamente a partir dun banco de datos de 1,5 millóns de clientes de maior operadora de telefonía móbil de Ruanda. Blumenstock e os seus colegas pediron aos participantes quixeron participar nunha investigación, explicou a natureza da investigación para eles, e, a continuación, fixo unha serie de preguntas sobre as súas características demográficas, sociais e económicas.

Todo o que teño dito ata agora fai este son como un levantamento tradicional das ciencias sociais. Pero, o que vén a continuación non é tradicional, polo menos non aínda. Utilizaban os datos da investigación para adestrar un modelo de aprendizaxe de máquina para prever a riqueza de alguén dos seus datos de chamadas e, a continuación, eles usar este modelo para estimar a riqueza de todo 1,5 millóns de clientes. A continuación, eles estimaron o lugar de residencia de todo 1,5 millóns de clientes a través da información xeográfica incorporado nos rexistros de chamadas. Poñer estas dúas estimacións xuntos, a riqueza estimada eo lugar estimado de residencia-Blumenstock e os seus compañeiros foron capaces de producir estimacións de alta resolución da distribución xeográfica de riqueza en toda Ruanda. En particular, eles poderían producir unha fortuna estimada para cada unha das células do Ruanda 2,148, a menor unidade administrativa no país.

Era imposible para validar estas estimacións porque ninguén nunca produciu estimacións para estas pequenas áreas xeográficas en Ruanda. Pero, cando Blumenstock e compañeiros agregadas as estimacións para 30 provincias de Ruanda, descubriron que as súas estimacións foron semellantes ás estimacións da Enquisa Demográfico e de Saúde, o patrón ouro das investigacións en países en desenvolvemento. Aínda que estas dúas enfoques produciu estimacións similares neste caso, o enfoque de Blumenstock e os seus colegas era preto de 10 veces máis rápido e 50 veces máis barato que as enquisas de Demografía e Saúde tradicionais. Estas estimacións de custos dramáticas máis rápidos e menores crear novas posibilidades de investigadores, gobernos e empresas (Blumenstock, Cadamuro, and On 2015) .

Ademais de desenvolver unha nova metodoloxía, este estudo é como unha especie de proba de Rorschach da mancha de tinta; que a xente ven depende do background. Moitos científicos sociais ver un novo instrumento de medida que se pode usar para probar teorías sobre o desenvolvemento económico. Moitos científicos de datos, consulte un novo problema legal aprendizaxe de máquina. Moitas persoas de negocios ver unha visión poderosa para desbloquear valor na datos de seguimento dixital que xa recollidos. Moitos defensores da privacidade ver un recordatorio asustado de que vivimos nunha época de vixilancia masiva. Moitos formuladores de políticas ver dun xeito que a nova tecnoloxía pode axudar a crear un mundo mellor. En realidade, este estudo é todas estas cousas, e é por iso que é unha fiestra ao futuro da investigación social.