1.1 Чарніла блот

Летам 2009 года мабільныя тэлефоны тэлефанавалі па ўсёй Руандзе. У дадатку да мільёнаў званкоў ад сям'і, сяброў і дзелавых партнёраў, каля 1000 Rwandans атрымалі званок ад Джошуа Blumenstock і яго калег. Гэтыя даследчыкі вывучалі багацце і беднасць шляхам правядзення абследавання выпадковай выбаркі людзей з базы дадзеных 1,5 млн абанентаў найбуйнейшага аператара сотавай сувязі Руанды. Blumenstock і яго калегі папрасілі выпадкова выбраных людзей, калі яны хочуць прыняць удзел у апытанні, патлумачыў прыроду даследаванняў ім, а затым задалі шэраг пытанняў, якія тычацца іх дэмаграфічных, сацыяльных і эканамічных характарыстык.

Усё, што я сказаў да гэтага часу робіць гэты гук як традыцыйнае абследаванне сацыяльных навук. Але што далей не з'яўляецца традыцыйным, па меншай меры, пакуль няма. У дадатку да дадзеных абследавання, Blumenstock і яго калегі таксама мелі поўныя запісу выклікаў для ўсіх 1,5 мільёна людзей. Спалучэнне гэтых двух крыніц дадзеных, яны выкарысталі дадзеныя даследаванні для падрыхтоўкі мадэлі машыннага навучання для прагназавання багацця чалавека на аснове сваіх запісаў выклікаў. Затым яны выкарыстоўвалі гэтую мадэль для ацэнкі багацця ўсіх 1,5 млн кліентаў у базе дадзеных. Яны таксама ацанілі месца пражывання ўсіх 1,5 мільёнаў кліентаў з выкарыстаннем геаграфічнай інфармацыі, заключанай у запісе выклікаў. Паклаўшы усё гэта разам, паводле ацэнак, багацця і ацэненае месца жыхарства, яны былі ў стане вырабляць карты высокага дазволу геаграфічнага размеркавання багацця ў Руандзе. У прыватнасці, яны могуць вырабіць ацэначную багацця для кожнай з вочак Руанды 2148, найменшую адміністрацыйную адзінку ў краіне.

На жаль, гэта было немагчыма пацвердзіць дакладнасць гэтых ацэнак, таму што ніхто не быў калі-небудзь была створана для ацэнкі такіх малых геаграфічных раёнаў у Руандзе. Але калі Blumenstock і калегі агрэгуе сваімі ацэнкамі 30 раёнаў Руанды, яны выявілі, што іх ацэнкі былі вельмі блізкія да ацэнак ад дэмаграфіі і здароўя, які шырока лічыцца залатым стандартам даследаванняў у краінах, якія развіваюцца. Хоць гэтыя два падыходу атрыманы аналагічныя ацэнкі ў гэтым выпадку падыход Blumenstock і яго калег было каля 10 разоў хутчэй і ў 50 разоў танней, чым у традыцыйных дэмаграфічных і медыка-санітарных абследаванняў. Гэтыя значна хутчэй і больш нізкія ацэнкі кошту ствараюць новыя магчымасці для даследчыкаў, урадаў і кампаній (Blumenstock, Cadamuro, and On 2015) .

Гэта даследаванне накшталт як тэст Роршаха Роршаха: што людзі бачаць у залежнасці ад іх паходжання. Многія сацыёлагі бачаць новы інструмент вымярэння , які можа быць выкарыстаны для праверкі тэорый аб эканамічным развіцці. Многія навукоўцы дадзеных см халаднаватую новую праблему машыннага навучання. Шматлікія дзелавыя людзі бачаць магутны падыход да разгадкі значэння ў вялікім дадзеных , якія яны ўжо сабралі. Многія абаронцы прыватнага жыцця бачаць страшнае напамін пра тое , што мы жывем у эпоху масавага назірання. І , нарэшце, многія распрацоўшчыкі палітыкі бачаць так , што новая тэхналогія можа дапамагчы стварыць лепшы свет. На самай справе, гэта даследаванне ўсе гэтыя рэчы, і таму, што ён мае гэтую сумесь характарыстык, я бачу гэта як акно ў будучыню сацыяльных даследаванняў.