1.1 एक स्याही दाग

2009 की गर्मियों में, मोबाइल फोन रवांडा भर में सभी बज रहे थे। परिवार, दोस्तों, और व्यापार सहयोगियों के बीच कॉल के लाखों लोगों के अलावा, 1000 के बारे में Rwandans यहोशू Blumenstock और उनके सहयोगियों से एक फोन आया। शोधकर्ताओं लोग हैं, जो बेतरतीब ढंग रवांडा की सबसे बड़ी मोबाइल फोन सेवा प्रदाता से 15 लाख ग्राहकों के एक डेटाबेस से जांचा गया था के एक सर्वेक्षण के संचालन से धन और गरीबी अध्ययन कर रहे थे। Blumenstock और उनके सहयोगियों ने प्रतिभागियों से पूछा कि क्या वे एक सर्वेक्षण में भाग लेने के लिए चाहते थे कि उन्हें अनुसंधान की प्रकृति के बारे में बताया, और फिर उनके जनसांख्यिकीय, सामाजिक और आर्थिक विशेषताओं के बारे में सवालों की एक श्रृंखला के लिए कहा।

सब कुछ मैं ने कहा कि अब तक एक पारंपरिक सामाजिक विज्ञान सर्वेक्षण की तरह इस ध्वनि बनाता है। लेकिन, क्या अगले आता नहीं पारंपरिक, कम से कम अभी तक नहीं है। वे सर्वेक्षण के आंकड़ों का इस्तेमाल किया एक मशीन सीखने मॉडल प्रशिक्षित करने के लिए उनके फोन डेटा से किसी के धन की भविष्यवाणी करने के लिए, और फिर वे सब 15 लाख ग्राहकों के धन अनुमान लगाने के लिए इस मॉडल का इस्तेमाल किया। इसके बाद, वे कॉल लॉग्स में एम्बेडेड भौगोलिक जानकारी का उपयोग करके सभी 15 लाख ग्राहकों के निवास की जगह का अनुमान है। इन दोनों को एक साथ अनुमान अनुमान धन और की अनुमानित जगह लाना निवास-Blumenstock और उनके सहयोगियों रवांडा भर में धन की भौगोलिक वितरण के उच्च संकल्प अनुमान का उत्पादन करने में सक्षम थे। विशेष रूप से, वे एक अनुमान के अनुसार धन रवांडा के 2,148 कोशिकाओं में से प्रत्येक के लिए, छोटी प्रशासनिक इकाई देश में उत्पादन कर सकता है।

ऐसा नहीं है क्योंकि कोई भी कभी भी रवांडा में इस तरह के छोटे भौगोलिक क्षेत्रों के लिए अनुमान का उत्पादन किया था इन अनुमानों को मान्य करने के लिए असंभव था। लेकिन, जब Blumenstock और उनके सहयोगियों ने रवांडा के 30 जिलों के लिए अपने अनुमान एकत्रित, उन्होंने पाया कि उनके अनुमान जनसांख्यिकीय और स्वास्थ्य सर्वेक्षण, विकासशील देशों में सर्वेक्षण के सोने के मानक के अनुमान के समान थे। हालांकि इन दो दृष्टिकोण इस मामले में इसी तरह के अनुमान का उत्पादन किया, Blumenstock और उनके सहयोगियों के दृष्टिकोण के बारे में 10 गुना तेजी से और 50 बार पारंपरिक जनसांख्यिकीय और स्वास्थ्य सर्वेक्षण की तुलना में सस्ता था। ये नाटकीय रूप से तेजी से और कम लागत अनुमान शोधकर्ताओं, सरकारों के लिए नई संभावनाएं पैदा, और कंपनियों (Blumenstock, Cadamuro, and On 2015)

एक नई पद्धति के विकास के अलावा, इस अध्ययन तरह का एक रॉर्सचाक् inkblot परीक्षण की तरह है, क्या लोगों को देखते हैं उनकी पृष्ठभूमि पर निर्भर करता है। कई सामाजिक वैज्ञानिकों ने एक नई माप उपकरण है कि आर्थिक विकास के बारे में सिद्धांत का परीक्षण करने के लिए इस्तेमाल किया जा सकता है। कई डेटा वैज्ञानिकों ने एक शांत नई मशीन सीखने की समस्या को देखते हैं। कई व्यापार लोगों को डिजिटल डेटा का पता लगाने कि वे पहले से ही एकत्र किया है में मूल्य का ताला खोलने के लिए एक शक्तिशाली दृष्टिकोण से देखते हैं। कई गोपनीयता अधिवक्ताओं एक डरावना याद आता है कि हम बड़े पैमाने पर निगरानी के लिए एक समय में रहते हैं देखते हैं। कई नीति निर्माताओं के लिए एक ही रास्ता है कि नई तकनीक के लिए एक बेहतर दुनिया बनाने में मदद कर सकते हैं। वास्तव में, यह अध्ययन उन सब बातों के लिए है, और क्यों यह सामाजिक अनुसंधान के भविष्य में एक खिड़की है।