1.1 Ein Tintenklecks

Im Sommer 2009 klingelten überall in Ruanda Handys. Zusätzlich zu den Millionen von Anrufen von Familie, Freunden und Geschäftspartnern erhielten etwa 1.000 Ruander einen Anruf von Joshua Blumenstock und seinen Kollegen. Diese Forscher untersuchten Reichtum und Armut, indem sie eine Stichprobe von Personen aus einer Datenbank von 1,5 Millionen Kunden des größten Mobilfunkanbieters in Ruanda befragt haben. Blumenstock und Kollegen befragten die zufällig ausgewählten Personen, ob sie an einer Umfrage teilnehmen wollten, erläuterten ihnen die Art der Forschung und stellten dann eine Reihe von Fragen zu ihren demografischen, sozialen und wirtschaftlichen Merkmalen.

Alles, was ich bisher gesagt habe, klingt nach einer traditionellen sozialwissenschaftlichen Umfrage. Aber was als nächstes kommt, ist nicht traditionell - zumindest noch nicht. Blumstock und Kollegen hatten neben den Umfragedaten auch die kompletten Anruflisten für alle 1,5 Millionen Menschen. Durch die Kombination dieser beiden Datenquellen nutzten sie die Umfragedaten, um ein maschinelles Lernmodell zu trainieren, mit dem der Wohlstand einer Person auf der Basis ihrer Anrufdaten vorhergesagt werden konnte. Als nächstes verwendeten sie dieses Modell, um den Reichtum aller 1,5 Millionen Kunden in der Datenbank zu schätzen. Sie schätzten auch die Wohnorte aller 1,5 Millionen Kunden anhand der geografischen Informationen, die in den Anruflisten enthalten sind. Mit all dem zusammen, dem geschätzten Wohlstand und dem geschätzten Wohnort, konnten sie hochauflösende Karten der geographischen Verteilung des Reichtums in Ruanda erstellen. Insbesondere könnten sie einen geschätzten Wohlstand für jede der 2148 Zellen Ruandas, der kleinsten Verwaltungseinheit des Landes, produzieren.

Leider war es nicht möglich, die Genauigkeit dieser Schätzungen zu bestätigen, da niemand jemals Schätzungen für so kleine geografische Gebiete in Ruanda erstellt hatte. Aber als Blumenstock und seine Kollegen ihre Schätzungen in die 30 Bezirke Ruandas zusammenfassten, stellten sie fest, dass ihre Schätzungen den Schätzungen aus dem Demographic and Health Survey sehr ähnlich waren, der weithin als der Goldstandard von Umfragen in Entwicklungsländern gilt. Obwohl diese beiden Ansätze in diesem Fall ähnliche Schätzungen lieferten, war der Ansatz von Blumenstock und Kollegen etwa 10-mal schneller und 50-mal billiger als die traditionellen Demographic and Health Surveys. Diese drastisch schnelleren und kostengünstigeren Schätzungen eröffnen Forschern, Regierungen und Unternehmen neue Möglichkeiten (Blumenstock, Cadamuro, and On 2015) .

Diese Studie ähnelt einem Rorschach-Tintenkleks-Test: Was Menschen sehen, hängt von ihrem Hintergrund ab. Viele Sozialwissenschaftler sehen ein neues Messinstrument, mit dem Theorien zur wirtschaftlichen Entwicklung getestet werden können. Viele Datenwissenschaftler sehen ein cooles neues Problem beim maschinellen Lernen. Viele Geschäftsleute sehen einen leistungsfähigen Ansatz, um in den Big Data, die sie bereits gesammelt haben, Werte zu erschließen. Viele Befürworter der Privatsphäre sehen eine erschreckende Erinnerung daran, dass wir in einer Zeit der Massenüberwachung leben. Und schließlich sehen viele politische Entscheidungsträger einen Weg, wie neue Technologien dazu beitragen können, eine bessere Welt zu schaffen. Tatsächlich ist diese Studie all diese Dinge, und weil sie diese Mischung von Eigenschaften hat, sehe ich sie als ein Fenster in die Zukunft der Sozialforschung.