1.1 Ein Tintenklecks

Im Sommer 2009, Mobiltelefone klingelten überall in Ruanda. Zusätzlich zu den Millionen von Anrufen zwischen Familie, Freunden und Geschäftspartnern, etwa 1000 Ruander erhielt einen Anruf von Joshua Blumenstock und seine Kollegen. Die Forscher studierten Reichtum und Armut durch eine Befragung von Menschen, die Durchführung, die zufällig aus einer Datenbank von 1,5 Millionen Kunden aus Ruanda größter Mobilfunkanbieter abgetastet worden war. Blumenstock und Kollegen baten die Teilnehmer, ob sie in einer Umfrage, erklärt die Art der Forschung zu ihnen, und dann gebeten, eine Reihe von Fragen über ihre demografischen, sozialen und wirtschaftlichen Merkmale teilnehmen wollten.

Alles, was ich bis jetzt gesagt up macht dieses Geräusch wie eine traditionelle sozialwissenschaftlichen Erhebung. Aber was kommt, ist neben nicht traditionell, zumindest noch nicht. Sie benutzten die Vermessungsdaten eine Maschine Lernmodell zu trainieren jemand Reichtum von ihren Gesprächsdaten vorherzusagen, und dann nutzten sie dieses Modell den Reichtum aller 1,5 Millionen Kunden zu schätzen. Als nächstes schätzt sie den Wohnsitz aller 1,5 Millionen Kunden durch die geographische Informationen in den Anrufprotokolle eingebettet werden. Setzt man diese beiden Schätzungen zusammen der geschätzte Reichtum und die geschätzte Wohnsitz-Blumenstock und Kollegen waren in der Lage, hochauflösende Schätzungen der geographischen Verteilung des Reichtums in Ruanda zu erzeugen. Insbesondere könnte sie einen geschätzten Reichtum für jeden von Ruandas 2148 Zellen, die kleinste Verwaltungseinheit im Land produzieren.

Es war unmöglich, diese Schätzungen zu bestätigen, weil niemand jemals Schätzungen für solche kleinen geographischen Gebieten in Ruanda produziert hatte. Aber, wenn Blumenstock und Kollegen ihre Schätzungen auf 30 Bezirke Ruanda aggregiert, stellten sie fest, dass ihre Schätzungen Schätzungen der demographischen Umfrage ähnlich waren, den Goldstandard von Umfragen in den Entwicklungsländern. Obwohl diese beiden Ansätze ähnliche Schätzungen in diesem Fall erzeugt, war der Ansatz von Blumenstock und Kollegen etwa 10-mal schneller und 50-mal billiger als die traditionellen Demographic and Health Surveys. Diese dramatisch schneller und niedrigere Kostenschätzungen schaffen neue Möglichkeiten für Forscher, Regierungen und Unternehmen (Blumenstock, Cadamuro, and On 2015) .

Neben der Bereitstellung einer neuen Methodik zu entwickeln, ist diese Studie ein bisschen wie ein Rorschachtest; was die Leute sehen, hängt von ihrem Hintergrund. Viele Sozialwissenschaftler sehen ein neues Messwerkzeug , das verwendet werden kann , Theorien über die wirtschaftliche Entwicklung zu testen. Viele Daten Wissenschaftler sehen einen kühlen neuen Maschine Lernproblem. Viele Geschäftsleute sehen einen leistungsstarken Ansatz für Wert in der digitalen Trace - Daten Entriegelung , die sie bereits gesammelt haben. Viele Datenschützer sehen eine beängstigende Erinnerung daran , dass wir in einer Zeit der Massenüberwachung leben. Viele Entscheidungsträger sehen einen Weg , die neue Technologie helfen kann , eine bessere Welt zu schaffen. In der Tat ist diese Studie all diese Dinge, und das ist, warum es ein Fenster in die Zukunft der Sozialforschung.