1.1 Une tache d'encre

À l'été 2009, les téléphones mobiles sonnent partout au Rwanda. En plus des millions d'appels entre la famille, les amis et les associés d'affaires, environ 1.000 Rwandais ont reçu un appel de Joshua Blumenstock et ses collègues. Les chercheurs ont étudié la richesse et la pauvreté en menant une enquête sur les personnes qui avaient été choisis au hasard à partir d'une base de données de 1,5 millions de clients du plus grand opérateur de téléphonie mobile du Rwanda. Blumenstock et ses collègues ont demandé aux participants si elles voulaient participer à une enquête, a expliqué la nature de la recherche pour eux, puis a posé une série de questions sur leurs caractéristiques démographiques, sociales et économiques.

Tout ce que j'ai dit jusqu'à maintenant fait ce bruit comme une enquête traditionnelle en sciences sociales. Mais, ce qui vient ensuite est pas traditionnelle, du moins pas encore. Ils ont utilisé les données de l'enquête pour former un modèle d'apprentissage de la machine pour prédire la richesse de quelqu'un de leurs données d'appel, puis ils ont utilisé ce modèle pour estimer la richesse de tous les 1,5 million de clients. Ensuite, ils ont estimé le lieu de résidence de tous les 1,5 million de clients en utilisant l'information géographique intégrée dans les journaux d'appels. Mettre ces deux estimations ensemble, la richesse estimée et le lieu de résidence estimée-Blumenstock et ses collègues ont réussi à produire des estimations à haute résolution de la répartition géographique de la richesse à travers le Rwanda. En particulier, ils pourraient produire une fortune estimée pour chacun des 2.148 cellules du Rwanda, la plus petite unité administrative dans le pays.

Il était impossible de valider ces estimations parce que personne ne l'avait jamais produit des estimations pour ces petites régions géographiques au Rwanda. Mais, quand Blumenstock et ses collègues agrégés leurs estimations 30 districts du Rwanda, ils ont constaté que leurs estimations étaient semblables à des estimations de l'Enquête démographique et de santé, la norme des enquêtes dans les pays en développement de l'or. Bien que ces deux approches ont produit des estimations similaires dans ce cas, l'approche de Blumenstock et ses collègues était environ 10 fois plus rapide et 50 fois moins cher que les enquêtes démographiques et sanitaires traditionnels. Ces estimations considérablement plus rapides et moins coûteux de créer de nouvelles possibilités pour les chercheurs, les gouvernements et les entreprises (Blumenstock, Cadamuro, and On 2015) .

En plus de développer une nouvelle méthodologie, cette étude est un peu comme un test de Rorschach; ce que les gens voient dépend de leur origine. De nombreux chercheurs en sciences sociales voient un nouvel outil de mesure qui peut être utilisé pour tester les théories sur le développement économique. De nombreux scientifiques de données voient un nouveau problème d'apprentissage machine cool. Beaucoup de gens d'affaires voient une approche puissante pour déverrouiller la valeur dans les données de trace numérique qu'ils ont déjà recueillies. De nombreux défenseurs de la vie privée voient un rappel effrayant que nous vivons dans un temps de surveillance de masse. De nombreux décideurs voient un moyen que la nouvelle technologie peut aider à créer un monde meilleur. En fait, cette étude est toutes ces choses, et qui est la raison pour laquelle il est une fenêtre sur l'avenir de la recherche sociale.