1.1 لکه جوهر

در تابستان سال 2009، تلفن های همراه در سراسر رواندا زنگ زدند. علاوه بر میلیون ها تماس از خانواده، دوستان و همکاران کسب و کار، حدود 1000 رواندا از تماس جوشوا بلومنستاک و همکارانش دریافت کردند. این محققان با بررسی یک نمونه تصادفی از یک پایگاه داده از 1.5 میلیون مشتری بزرگترین ارائه دهنده تلفن همراه در رواندا، با بررسی وضعیت ثروت و فقر، مطالعه کردند. بلومنستاک و همکارانش از افرادی که به صورت تصادفی انتخاب شده بودند خواسته بودند اگر می خواستند در یک نظرسنجی شرکت کنند، ماهیت تحقیق را برای آنها توضیح دادند و سپس از مجموعه ای از سوالات در مورد ویژگی های جمعیتی، اجتماعی و اقتصادی خویش پرسیدند.

همه چیزهایی که تا به حال گفته ام این را به عنوان یک نظرسنجی سنتی علوم اجتماعی می خوانم. اما چیزی که بعدا به دست نمی آید، حداقل سنتی نیست. علاوه بر داده های نظرسنجی، Blumenstock و همکارانش نیز سوابق تماس کامل برای همه 1.5 میلیون نفر داشتند. ترکیب این دو منبع داده ها، از داده های نظرسنجی برای آموزش یک مدل یادگیری ماشین برای پیش بینی ثروت شخص بر اساس سوابق تماس خود استفاده کردند. بعد، آنها از این مدل برای تخمین ثروت تمام 1.5 میلیون مشتری در پایگاه داده استفاده کردند. آنها همچنین محل های اقامت همه 1.5 میلیون مشتری را با استفاده از اطلاعات جغرافیایی که در پرونده های تماس جاسازی شده است، تخمین زده اند. قرار دادن همه اینها با هم - ثروت تخمینی و محل تخمینی محل اقامت - آنها توانستند نقشه های با وضوح بالا را از توزیع جغرافیایی ثروت در رواندا تهیه کنند. به طور خاص، آنها می توانند ثروت تخمینی را برای هر یک از 1448 سلول رواندا، کوچکترین واحد اداری در کشور تولید کنند.

متاسفانه دقت این برآوردها را معتبر دانست، زیرا هیچ کس تا به حال برآورد هایی برای چنین مناطق جغرافیایی کوچک در رواندا تولید نکرده است. اما زمانی که Blumenstock و همکارانش برآوردهای خود را به 30 ولسوالی رواندا تقسیم کردند، آنها دریافتند که برآوردهای آنها بسیار مشابه تخمین ها از نظرسنجی جمعیت شناختی و بهداشتی است که به طور گسترده به عنوان استاندارد طلا در نظرسنجی ها در کشورهای در حال توسعه مورد توجه قرار گرفته است. اگر چه این دو رویکرد برآوردهای مشابهی در این مورد به دست آوردند، رویکرد Blumenstock و همکارانش حدود 10 برابر سریعتر و 50 برابر ارزان تر از نظرسنجی سنتی جمعیت و سلامت بود. این برآورد هزینه های سریع و کم هزینه فرصت های جدیدی را برای محققان، دولت ها و شرکت ها (Blumenstock, Cadamuro, and On 2015) .

این مطالعه نوعی از تست تزریقی Rorschach است: آنچه که مردم می بینند بستگی به پیشینه آنها دارد. بسیاری از دانشمندان علوم اجتماعی ابزار اندازه گیری جدیدی را می بینند که می تواند برای تست نظریه های توسعه اقتصادی استفاده شود. بسیاری از دانشمندان داده ها یک مشکل جدید برای یادگیری ماشین جدید را می بینند. بسیاری از افراد کسب و کار یک رویکرد قدرتمند برای باز کردن ارزش در داده های بزرگ که قبلا جمع آوری کرده اند را می بینند. بسیاری از طرفداران حفظ حریم خصوصی ، یادآوری ترسناکی را که در زمان نظارت جمعی زندگی می کنند، می بینیم. و در نهایت، بسیاری از سیاست گذاران راهی را پیدا می کنند که فناوری جدید می تواند به ایجاد یک جهان بهتر کمک کند. در حقیقت، این مطالعه همه چیزهایی است و به این دلیل که این ترکیب ویژگی هاست، من آن را به عنوان یک پنجره در آینده از تحقیقات اجتماعی می بینم.