1.1 एक शाई कलंक

200 9च्या उन्हाळ्यात रवांडामध्ये मोबाइल फोन सगळीकडे ओरडत होता. कौटुंबिक, मित्र आणि व्यावसायिक सहकाऱ्यांतील लाखो कॉल्सांव्यतिरिक्त, सुमारे 1,000 रवांडाला यहोशू ब्लूमनस्टॉक आणि त्यांचे सहकारी यांच्याकडून फोन आला. हे संशोधक रवांडाच्या सर्वात मोठ्या मोबाइल फोन प्रदात्याच्या 15 लाख ग्राहकांच्या डेटाबेसच्या लोकांच्या यादृच्छिक नमुन्याचे सर्वेक्षण करून मालमत्ता आणि गरिबीचा अभ्यास करत होते. ब्लूमनस्टॉक आणि त्यांच्या सहकाऱ्यांनी यादृच्छिकरित्या निवडलेल्या लोकांना विचारले की जर ते एखाद्या सर्वेक्षणात भाग घेऊ इच्छित असतील, तर त्यांच्या संशोधनाचे स्वरूप समजावून सांगितले आणि नंतर त्यांच्या लोकसांख्यिकीय, सामाजिक आणि आर्थिक वैशिष्ट्यांबद्दल अनेक प्रश्नांची उत्तरे विचारले.

आतापर्यंत मी म्हटल्याप्रमाणे सर्वसामान्य सामाजिक विज्ञान सर्वेक्षणाप्रमाणे या आवाजाची निर्मिती करतो. पण पुढे काय येतात ते पारंपारिक नाही-किमान अद्याप नाही. सर्वेक्षण डेटा व्यतिरिक्त, ब्लूमनस्टॉक आणि सहकर्मींना देखील 15 लाख लोकांसाठी पूर्ण कॉल रेकॉर्ड केले गेले. या दोन स्रोतांचे एकत्रिकरण करून, त्यांनी सर्वेक्षण अहवालाचा वापर मशीन शिकण्याचे मॉडेल प्रशिक्षित करण्यासाठी केला आहे ज्याने त्यांच्या कॉल रेकॉर्डवर आधारित व्यक्तीच्या संपत्तीचा अंदाज लावला. त्यानंतर, त्यांनी या मॉडेलचा वापर डेटाबेसमधील 15 लाख ग्राहकांच्या संपत्तीचा अंदाज लावला. कॉल रेकॉर्डमध्ये एम्बेड केलेल्या भौगोलिक माहितीचा वापर करून सर्व 1.5 दशलक्ष ग्राहकांच्या निवासस्थानाचा अंदाज त्यांनी दिला. या सर्व गोष्टी एकत्रितपणे-अंदाजे संपत्ती आणि निवासस्थानची अंदाजे जागा- ते रवांडातील संपत्तीचे भौगोलिक वितरण अधिक चांगले रिझोल्यूशन नकाशे तयार करण्यास सक्षम होते. विशेषतः, ते रवांडाच्या 2,148 पेशींपैकी प्रत्येकासाठी अंदाजे संपत्ती निर्माण करू शकतील, देशातील सर्वात लहान प्रशासकीय एकक.

दुर्दैवाने, या अनुमानांची अचूकता मान्य करणे अशक्य होते कारण रवांडामधील अशा लहान भौगोलिक भागांसाठी कोणीही अंदाज बांधला नव्हता. पण जेव्हा ब्लूमनस्टॉक आणि त्यांचे सहकाऱ्यांनी रवांडाच्या 30 जिल्ह्यांतील त्यांचे अंदाज गोळा केले तेव्हा त्यांना असे आढळले की त्यांचे अंदाज लोकसांख्यिकीय आणि आरोग्य सर्वेक्षणाचे अंदाज सारख्याच आहेत, जे विकसनशील देशांमधील मोठ्या प्रमाणावर सर्वेक्षणाचे मानले जाते. या दोन पध्दतींनी या प्रकरणात समान अंदाज तयार केले असले तरी, ब्लूमनस्टॉक आणि सहकाऱ्यांचे दृष्टिकोण सुमारे 10 पट वेगवान आणि पारंपारिक डेमोग्राफिक आणि आरोग्य सर्वेक्षणाच्या तुलनेत 50 पटीने स्वस्त होते. हे नाटकीय जलद आणि कमी किमतीचे अनुमान संशोधक, सरकार आणि कंपन्यांसाठी नवीन संभाव्यता (Blumenstock, Cadamuro, and On 2015) .

हा अभ्यास एक प्रकारचा रॉर्स्च शाईच्या परीक्षणासारखा आहे: लोक काय पाहतात ते त्यांच्या पार्श्वभूमीवर अवलंबून असतात. अनेक सामाजिक शास्त्रज्ञांना एक नवीन मापन साधन दिलेले आहे जे आर्थिक विकासाबद्दल सिद्धांत चाचणी करण्यासाठी वापरले जाऊ शकते. बर्याच डेटा शास्त्रज्ञांना एक थंड नवीन मशीन शिकण्याची समस्या आहे. बर्याच व्यवसायिक लोक ते आधीच संग्रहित केलेल्या मोठ्या डेटामधील मूल्य अनलॉक करण्याकरिता एक प्रभावी दृष्टिकोण पाहतात. बरेच गोपनीयता वकिल एक धडकी भरवणारा अनुस्मरण पाहतात की आम्ही जनतेच्या देखरेखीच्या काळात राहतो. आणि अखेरीस, अनेक धोरण निर्मात्यांना असे दिसते की नवीन तंत्रज्ञान एक चांगले जग तयार करण्यास मदत करते. खरं तर, हा अभ्यास सर्व गोष्टी आहे, आणि कारण या वैशिष्ट्यांचे हे मिश्रण आहे, मी हे सामाजिक संशोधनाच्या भविष्यामध्ये एक खिडकी म्हणून पाहतो.