1.1 Rašalo dėmė

2009 m. Vasarą mobilieji telefonai skambėjo visoje Ruandoje. Be daugybės skambučių iš šeimos, draugų ir verslo partnerių, apie 1000 Ruandos skambėjo Joshua Blumenstock ir jo kolegos. Šie mokslininkai studijavo turtus ir skurdą, atlikdami atsitiktinai atrinktos žmonių apklausą iš 1,5 milijono klientų iš didžiausio Ruandos mobiliųjų telefonų teikėjo duomenų bazės. Blumenstockas ir jo kolegos paprašė atsitiktinai atrinktų žmonių, norėdami dalyvauti apklausoje, paaiškino jiems atlikto tyrimo pobūdį ir pateikė daug klausimų apie jų demografines, socialines ir ekonomines ypatybes.

Viskas, ką sakiau iki šiol, daro tai, kaip ir tradicinis socialinių mokslų tyrimas. Bet to, kas ateina toliau, nėra tradicinis - bent jau dar ne. Be apklausos duomenų, "Blumenstock" ir jo kolegos taip pat turėjo visus 1,5 mln. Žmonių skambučių įrašus. Sujungdami šiuos du duomenų šaltinius, jie naudojo apklausos duomenis, kad mokytų mašininio mokymosi modelį, kad prognozuotų asmens turtą, pagrįstą jų skambučių įrašais. Be to, jie naudojo šį modelį, kad įvertintų visų 1,5 milijono klientų turtą duomenų bazėje. Jie taip pat įvertino visų 1,5 milijono klientų gyvenamosios vietos, naudojančias geografinę informaciją, įtrauktą į skambučių įrašus. Visa tai išdėstydama kartu - apskaičiuotą turtą ir numatomą gyvenamąją vietą - jie galėjo kurti didelės skiriamosios gebos geografinio turto paskirstymo Ruandoje žemėlapius. Visų pirma, jie gali pagaminti apskaičiuotą turto vertę kiekvienam Ruandos 2 148 ląstelėms - mažiausiam šalies administraciniam vienetui.

Deja, neįmanoma patvirtinti šių įvertinimų tikslumo, nes niekas niekada nepateikė tokių mažų geografinių vietovių Ruandoje įvertinimų. Tačiau, kai Blumenstock ir jo kolegos apibendrino savo sąmatas Ruandos 30 rajonams, jie nustatė, kad jų skaičiavimai buvo labai panašūs į Demografijos ir sveikatos tyrimo duomenis, kurie yra plačiai laikomi auksiniu tyrimų standartų lygiu besivystančiose šalyse. Nors šie du metodai šiuo atveju sukūrė panašius įvertinimus, Blumenstock ir kolegų požiūris buvo apie 10 kartų spartesnis ir 50 kartų pigesnis nei tradicinės demografinės ir sveikatos tyrimai. Šie žymiai spartesni ir mažesni sąnaudų skaičiavimai sukuria naujas galimybes mokslininkams, vyriausybėms ir įmonėms (Blumenstock, Cadamuro, and On 2015) .

Šis tyrimas yra toks pat kaip "Rorschach inkblot" testas: tai, ko žmonės mato, priklauso nuo jų buvimo. Daugelis socialinių mokslų žiūri naują matavimo priemonę, kuri gali būti naudojama tiriant teorijas apie ekonominę plėtrą. Daugybė duomenų mokslininkai mato kietą naują mašinų mokymosi problemą. Daugelis verslo žmonių mato galingą požiūrį į didelių duomenų, kuriuos jie jau surinko, atraižą. Daugelis privatumo palaikytojų mato baisų priminimą, kad mes gyvename masinio stebėjimo metu. Ir pagaliau daugelis politikos formuotojai mato būdą, kad naujos technologijos gali padėti sukurti geresnį pasaulį. Tiesą sakant, šis tyrimas yra visi šie dalykai, ir dėl to, kad jis turi tokį ypatybių derinį, aš jį suprantu kaip į socialinių tyrimų ateitį.