1.1 Едно петно ​​мастило

През лятото на 2009 г., мобилни телефони звъняха цяла Руанда. В допълнение към милионите разговори между семейството, приятели и бизнес партньори, около 1000 руандийците получили обаждане от Joshua Blumenstock и колегите му. Изследователите изучават богатството и бедността чрез провеждане на изследване на хора, които са били произволно проби и от база данни на 1,5 милиона клиенти от най-големия мобилен оператор в Руанда. Blumenstock и колеги зададен на участниците, ако искат да участват в проучване, обясни естеството на изследването им, и след това зададен серия от въпроси за техните демографски, социални, и икономически характеристики.

Всичко, което съм казал до сега прави този звук като традиционната анкета на социалните науки. Но, това, което идва след това не е традиционна, поне не още. Те се използват данните от изследването да се обучават модел машина учене да се предскаже нечия богатство от техните данни за повикване, а след това те използва този модел, за да се оцени богатството на всички 1,5 милиона клиенти. След това, те изчислиха мястото на пребиваване на всички 1,5 милиона клиенти чрез използване на географската информация, вградена в трупите на повикването. Поставянето на тези две оценки заедно-очакваното богатство и оценява мястото на пребиваване-Blumenstock и колеги са били в състояние да произвежда прогнози с висока разделителна способност на географското разпределение на богатството в цяла Руанда. По-специално, те биха могли да произвеждат около богатство за всеки един от Руанда 2,148 клетки, най-малката административна единица в страната.

Беше невъзможно да се валидира тези оценки, защото никой не е произвеждан някога оценки за такива малки географски райони в Руанда. Но, когато Blumenstock и колеги обобщават оценките си за Руанда 30 области, те са установили, че оценките им са сходни с оценки от демографски и проучване на здравето, златен стандарт за изследвания в развиващите се страни. Въпреки, че тези два подхода дават подобни оценки в този случай, подходът на Blumenstock и колеги е около 10 пъти по-бързо и 50 пъти по-евтино от традиционните демографски и здравни изследвания. Тези драстично по-бързи и по-ниски оценки на разходите създават нови възможности за изследователите, правителства и компании (Blumenstock, Cadamuro, and On 2015) .

В допълнение към разработването на нова методика, това проучване е нещо като тест за inkblot Роршах; това, което хората виждат, зависи от техния произход. Много социални учени виждат ново измерване инструмент, който може да се използва за тестване на теории за икономическо развитие. Много учени данни виждат хладно нов проблем машинно обучение. Много бизнес хората виждат мощен подход за отключване стойност в цифров следи данните за които те вече са събрани. Много защитниците на личната виждат страшно напомняне, че ние живеем във време на масово наблюдение. Много политици виждат начин, че новата технология може да помогне за създаването на по-добър свят. В действителност, това проучване е, всички тези неща, и това е защо тя е прозорец към бъдещето на социалните изследвания.