1.1 Едно петно ​​мастило

През лятото на 2009 г. мобилните телефони звъняха из цяла Руанда. В допълнение към милионите обаждания от семейство, приятели и бизнес партньори, около 1000 руанди получиха обаждане от Joshua Blumenstock и колегите му. Тези изследователи са изучавали богатство и бедност, като са направили проучване на случайна извадка от хора от база данни от 1,5 милиона клиенти на най-големия доставчик на мобилни телефони в Руанда. Blumenstock и колегите попитаха произволно избраните хора дали искат да участват в проучване, обясняват естеството на изследването и след това задават редица въпроси за техните демографски, социални и икономически характеристики.

Всичко, което казах досега, прави това звучи като традиционно социално-научно изследване. Но това, което следва, не е традиционно - поне още не. В допълнение към данните от проучването, Blumenstock и колегите също са имали пълни записи за всички 1,5 милиона души. Комбинирайки тези два източника на данни, те използваха данните от проучването, за да обучат модел за машинно обучение, за да предскажат богатството на дадено лице въз основа на техните записи. След това те използват този модел, за да оценят богатството на всички 1,5 милиона клиенти в базата данни. Те също изчислиха местата на пребиваване на всичките 1,5 милиона клиенти, използвайки географската информация, вградена в регистрите за обаждания. Като поставихме всичко това заедно - прогнозираното богатство и предполагаемото местопребиваване - те успяха да създадат карти с висока резолюция за географското разпределение на богатството в Руанда. По-конкретно, те биха могли да генерират прогнозно богатство за всяка от 2 148 клетки в Руанда - най-малкото административно звено в страната.

За съжаление не беше възможно да се потвърди точността на тези оценки, тъй като никой никога не е изготвял прогнози за такива малки географски райони в Руанда. Но когато Blumenstock и колегите обобщиха оценките си за 30 района в Руанда, те установиха, че техните оценки са много подобни на оценките от изследването "Демографско и здравно състояние", което широко се счита за златен стандарт на проучванията в развиващите се страни. Въпреки че тези два подхода са направили подобни оценки в този случай, подходът на Blumenstock и колегите е бил около 10 пъти по-бърз и 50 пъти по-евтин от традиционните демографски и здравни проучвания. Тези драстично по-бързи и по-ниски оценки на разходите създават нови възможности за изследователите, правителствата и компаниите (Blumenstock, Cadamuro, and On 2015) .

Това изследване е нещо като тест за Rorschach inkblot: това, което хората виждат, зависи от техния произход. Много социални учени виждат нов инструмент за измерване, който може да се използва за тестване на теории за икономическото развитие. Много изследователи на данни виждат страхотен нов проблем с машинното обучение. Много бизнес хора виждат мощен подход за отключване на стойността в големите данни, които вече са събрали. Много защитници на неприкосновеността на личния живот виждат страшно напомняне, че живеем във време на масов надзор. И накрая, много политици виждат начин, по който новите технологии могат да помогнат за създаването на по-добър свят. Всъщност, това изследване е всичко това и тъй като има тази комбинация от характеристики, го виждам като прозорец в бъдещето на социалните изследвания.