1.1 एक स्याही दाग

200 9 की गर्मियों में, मोबाइल फोन रवांडा भर में बज रहे थे। परिवार, दोस्तों और व्यापार सहयोगियों की लाखों कॉलों के अलावा, लगभग 1000 रवांडाओं को यहोशू ब्लूमेंस्टॉक और उनके सहयोगियों से एक कॉल प्राप्त हुई। ये शोधकर्ता रवांडा के सबसे बड़े मोबाइल फोन प्रदाता के 1.5 मिलियन ग्राहकों के डेटाबेस से लोगों के यादृच्छिक नमूने का सर्वेक्षण करके धन और गरीबी का अध्ययन कर रहे थे। ब्लूमेंस्टॉक और सहयोगियों ने यादृच्छिक रूप से चुने गए लोगों से पूछा कि क्या वे एक सर्वेक्षण में भाग लेना चाहते थे, उन्हें शोध की प्रकृति की व्याख्या की, और फिर उनके जनसांख्यिकीय, सामाजिक और आर्थिक विशेषताओं के बारे में प्रश्नों की एक श्रृंखला से पूछा।

मैंने जो भी कहा है, वह अब तक एक पारंपरिक सामाजिक विज्ञान सर्वेक्षण की तरह है। लेकिन अगला क्या आता है पारंपरिक नहीं है - कम से कम अभी तक नहीं। सर्वेक्षण आंकड़ों के अलावा, ब्लूमेंस्टॉक और सहकर्मियों के पास सभी 1.5 मिलियन लोगों के लिए पूर्ण कॉल रिकॉर्ड भी थे। डेटा के इन दो स्रोतों का संयोजन करते हुए, उन्होंने सर्वेक्षण डेटा का उपयोग मशीन सीखने के मॉडल को प्रशिक्षित करने के लिए किया ताकि वे अपने कॉल रिकॉर्ड के आधार पर किसी व्यक्ति की संपत्ति का अनुमान लगा सकें। इसके बाद, उन्होंने डेटाबेस में सभी 1.5 मिलियन ग्राहकों की संपत्ति का अनुमान लगाने के लिए इस मॉडल का उपयोग किया। उन्होंने कॉल रिकॉर्ड में एम्बेडेड भौगोलिक जानकारी का उपयोग करके सभी 1.5 मिलियन ग्राहकों के निवास स्थान की भी अनुमान लगाई। यह सब एक साथ रखकर-अनुमानित संपत्ति और निवास की अनुमानित जगह-वे रवांडा में धन के भौगोलिक वितरण के उच्च-रिज़ॉल्यूशन मानचित्र तैयार करने में सक्षम थे। विशेष रूप से, वे रवांडा की 2,148 कोशिकाओं, देश में सबसे छोटी प्रशासनिक इकाई के लिए अनुमानित संपत्ति का उत्पादन कर सकते हैं।

दुर्भाग्यवश, इन अनुमानों की सटीकता को मान्य करना असंभव था क्योंकि किसी ने कभी भी रवांडा में ऐसे छोटे भौगोलिक क्षेत्रों के अनुमानों का अनुमान नहीं लगाया था। लेकिन जब ब्लूमेंस्टॉक और सहयोगियों ने अपने अनुमानों को रवांडा के 30 जिलों में एकत्रित किया, तो उन्होंने पाया कि उनके अनुमान जनसांख्यिकीय और स्वास्थ्य सर्वेक्षण से अनुमानों के समान थे, जिसे व्यापक रूप से विकासशील देशों में सर्वेक्षणों का स्वर्ण मानक माना जाता है। यद्यपि इन दोनों दृष्टिकोणों ने इस मामले में इसी तरह के अनुमान प्रस्तुत किए हैं, लेकिन ब्लूमेंस्टॉक और सहयोगियों का दृष्टिकोण पारंपरिक जनसांख्यिकीय और स्वास्थ्य सर्वेक्षणों की तुलना में लगभग 10 गुना तेज और 50 गुना सस्ता था। ये नाटकीय रूप से तेज़ और कम लागत अनुमान शोधकर्ताओं, सरकारों और कंपनियों (Blumenstock, Cadamuro, and On 2015) लिए नई संभावनाएं पैदा करते हैं।

यह अध्ययन एक रोर्शचैच इंकब्लॉट परीक्षण की तरह है: जो लोग देखते हैं उनकी पृष्ठभूमि पर निर्भर करता है। कई सामाजिक वैज्ञानिकों को एक नया माप उपकरण दिखाई देता है जिसका उपयोग आर्थिक विकास के सिद्धांतों का परीक्षण करने के लिए किया जा सकता है। कई डेटा वैज्ञानिकों को एक अच्छी नई मशीन सीखने की समस्या दिखाई देती है। कई व्यवसायिक लोग पहले से एकत्र किए गए बड़े डेटा में मूल्य अनलॉक करने के लिए एक शक्तिशाली दृष्टिकोण देखते हैं। कई गोपनीयता समर्थक एक डरावनी अनुस्मारक देखते हैं कि हम जन निगरानी के समय रहते हैं। और अंत में, कई नीति निर्माताओं एक तरीका देखते हैं कि नई तकनीक बेहतर दुनिया बनाने में मदद कर सकती है। वास्तव में, यह अध्ययन उन सभी चीजों में से है, और क्योंकि इसमें विशेषताओं का मिश्रण है, मैं इसे सामाजिक शोध के भविष्य में एक खिड़की के रूप में देखता हूं।