3.6.2 გააქტიურებული

გაძლიერებული გეკითხებით გამოყენებით პროგნოზირების მოდელი, რათა დააკავშიროთ კვლევის მონაცემები რამდენიმე ადამიანი დიდი მონაცემთა წყარო ბევრი ადამიანი.

კვლევისა და დიდი მონაცემთა წყაროების კომბინირების განსხვავებული გზა არის პროცესი, რომელსაც მოვუწოდებთ გაძლიერებულ კითხვებს . მკითხველი იყენებს პროგნოზირებად მოდელს, რომ შეისწავლოს მცირე რაოდენობის კვლევის მონაცემები დიდი მონაცემთა წყაროსთან, რათა შეფასდეს მასშტაბი ან გრანულურობა, რომელიც არ შეიძლება იყოს ინდივიდუალურად ან მონაცემთა წყაროსთან. გაჟღერებული კითხვის მნიშვნელოვანი მაგალითია ჯოშუა ბლუმენტოკის მუშაობა, რომელსაც სურდა, შეაგროვოს მონაცემები, რომელიც ხელს შეუწყობდა გზის განვითარებას ღარიბ ქვეყნებში. წარსულში, ამგვარი მონაცემების შეგროვებას მკვლევარები ზოგადად უნდა მიეღოთ ერთ-ერთი ორი მიდგომა: ნიმუში გამოკვლევები ან აღწერები. ნიმუში კვლევები, სადაც მკვლევარებმა ინტერვიუ ჩაატარეს მცირე რაოდენობით, შეიძლება იყოს მოქნილი, დროული და შედარებით იაფი. თუმცა, ეს კვლევები, იმიტომ, რომ ისინი ნიმუშზეა დაფუძნებული, ხშირად მათი მოგვარების შეზღუდულია. ნიმუშის კვლევით, ხშირად ძნელია შეფასდეს კონკრეტული გეოგრაფიული რეგიონების ან კონკრეტული დემოგრაფიული ჯგუფების შესახებ. მეორე მხრივ, მოსახლეობის გასაუბრების მცდელობა და ა.შ. ისინი შეიძლება გამოყენებულ იქნეს მცირე გეოგრაფიული რეგიონების ან დემოგრაფიული ჯგუფების შეფასების მიზნით. მაგრამ მოსახლეობის აღწერები ზოგადად ძვირია და ვიწროა ფოკუსირებაში (მათ შორის მხოლოდ მცირე რაოდენობის კითხვები) და დროული არ არის (ისინი ყოველ 10 წელიწადში (Kish 1979) ) (Kish 1979) . იმის ნაცვლად, რომ არ მოხდეს ნიმუშების კვლევებისა და აღწერის საშუალებით, წარმოიდგინეთ, თუ მკვლევარები შეძლებენ ორივე მათგანის საუკეთესო თვისებებს. წარმოიდგინეთ, თუ მკვლევარები ყოველ კითხვაზე ყოველ კითხვას ყოველდღე უსვამენ. ცხადია, ამ ობსკვიდრო, ყოველთვის კვლევის არის სახის სოციალური მეცნიერების ფანტაზიით. მაგრამ, როგორც ჩანს, ჩვენ შეგვიძლია ვივარაუდოთ, რომ მივაღწიოთ ამ გამოკითხვის კითხვებს, რომელიც აერთიანებს მცირე რაოდენობით ადამიანებს ციფრული კვალი მრავალი ადამიანისგან.

Blumenstock- ის კვლევა დაიწყო, როდესაც იგი რუანდას ყველაზე მსხვილი მობილური ტელეფონის პროვაიდერთან პარტნიორობით დაიწყო, ხოლო კომპანია 2005 და 2009 წლებში დაახლოებით 1.5 მილიონ მომხმარებელს შორის ანონიმური გარიგებების ჩანაწერებს წარმოადგენდა. ეს ჩანაწერები შეიცავს ინფორმაციას თითოეული ზარისა და ტექსტური შეტყობინების შესახებ, როგორიცაა დაწყების დრო, ხანგრძლივობა , და აბონენტის და მიმღების სავარაუდო გეოგრაფიული მდებარეობა. სანამ ვსაუბრობ სტატისტიკურ საკითხებზე, უნდა აღინიშნოს, რომ ეს პირველი ნაბიჯი შეიძლება ბევრ მკვლევარზე იყოს უმძიმესი. მე, როგორც მე -2 თავი აღვნიშნეთ, მკვლევარებისთვის მიუწვდომელია ყველაზე დიდი მონაცემთა წყარო. კერძოდ, სატელეფონო მეტა-მონაცემები განსაკუთრებით მიუწვდომელია, რადგან ის, ფაქტობრივად, შეუძლებელია ანონიმურობის და თითქმის აუცილებლად შეიცავს ინფორმაციას, რომ მონაწილეები განიხილავენ მგრძნობიერებს (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . ამ კონკრეტულ შემთხვევაში, მკვლევარებმა ფრთხილად იყვნენ მონაცემთა დაცვა და მათი მუშაობა ზედამხედველობდა მესამე მხარის მიერ (ანუ მათი IRB). ამ ეთიკურ საკითხებზე მე უფრო დეტალურად დავუბრუნდები მე -6 თავში.

Blumenstock იყო დაინტერესებული საზომი სიმდიდრე და კეთილდღეობა. მაგრამ ეს თვისებები არ არის პირდაპირ ზარის ჩანაწერებში. სხვა სიტყვებით რომ ვთქვათ, ამ ზარის ჩანაწერები არასრულყოფილია ამ კვლევისთვის - დიდი მონაცემთა წყაროების საერთო მახასიათებელია, რომელიც დეტალურადაა განხილული მე -2 თავში. თუმცა, სავარაუდოდ, რომ ზარის ჩანაწერებს, შესაძლოა, ჰქონდეს გარკვეული ინფორმაცია, რომელიც შეიძლება არაპირდაპირ მიაწოდოს ინფორმაციას სიმდიდრეზე კეთილდღეობა. ამ შესაძლებლობის გათვალისწინებით, Blumenstock- ს კითხვა ჰქონდა თუ არა შესაძლებელი იმისთვის, რომ მოემზადებინა მანქანათმცოდნეობის მოდელი, რომ წინასწარმეტყველებდნენ, თუ ვინმეს პასუხობდა მათი ზარის ჩანაწერებზე დაფუძნებული კვლევა. თუ ეს შესაძლებელი იყო, მაშინ Blumenstock- ს შეუძლია გამოიყენოს ეს მოდელი 1.5 მილიონ მომხმარებელთა გამოკითხვის საპასუხოდ.

ასეთი მოდელის შესაქმნელად და მომზადების მიზნით, კიგალის მეცნიერებისა და ტექნოლოგიის ინსტიტუტის მკვლევარებმა დაათვალიერეს ბრუმენტოკი და კვლევითი თანაშემწეები ათასი აბონენტის შესახებ. მკვლევარებმა პროექტში მონაწილეთათვის მიზანშეწონილად განმარტა, თანხმობა მოითხოვდნენ კვლევის პასუხებს ზარის ჩანაწერებში და შემდეგ სთხოვეს კითხვების რიგს, რათა განეხორციელებინათ თავიანთი სიმდიდრე და კეთილდღეობა, მაგალითად, რადიოს? "და" ველოსიპედით ფლობ? "(იხ. სურათი 3.14 ნაწილობრივი სიისთვის). კვლევის ყველა მონაწილეს ფინანსურად კომპენსაცია გაუწიეს.

შემდეგი, Blumenstock გამოიყენება ორსაფეხურიანი პროცედურის საერთო მანქანა სწავლის: მხატვრული საინჟინრო მოჰყვა ზედამხედველობითი სწავლის. პირველ რიგში, საინჟინრო ნაბიჯში, ყველასთვის, ვისთვისაც იყო ინტერვიუ, Blumenstock მოაწერეს ზარის ჩანაწერებს თითოეული ადამიანის შესახებ თვისებების კომპლექტში; მონაცემთა მეცნიერებმა შეიძლება ამ მახასიათებლებს "თვისებები" უწოდეს და სოციალურ მეცნიერებს უწოდებენ მათ "ცვლადებს". მაგალითად, თითოეული ადამიანისთვის, ბლუმენტოქსი გამოითვლება მთელი დღის განმავლობაში აქტივობით, ცალკეული ადამიანების რიცხვი პირის კონტაქტში საეთერო დროის დახარჯულ თანხას და ა.შ. კრიტიკულად, კარგი ფუნქცია საინჟინრო მოითხოვს ცოდნის კვლევის გარემოში. მაგალითად, თუ მნიშვნელოვანია განასხვავოთ შიდა და საერთაშორისო ზარები (ჩვენ შეიძლება ველოდოთ იმ ადამიანებს, რომლებიც საერთაშორისო თანამეგობრობას ზრდიან), მაშინ ეს უნდა გაკეთდეს საინჟინრო ეტაპზე. მკვლევარი რუანდას მცირე გაგებით არ უნდა შეიცავდეს ამ ფუნქციას და შემდეგ მოდელის პროგნოზირებადი შესრულება იტანჯებოდა.

შემდეგი, ზედამხედველობითი სასწავლო ნაბიჯი, Blumenstock აშენდა მოდელი პროგნოზირება კვლევის პასუხი თითოეულ ადამიანს მათი თვისებები. ამ შემთხვევაში ბლუმენტოქსი გამოიყენებოდა ლოგისტიკური რეგრესიით, მაგრამ მას შეეძლო სხვა სტატისტიკური ან მექანიკური სწავლების მიდგომების გამოყენება.

რამდენად კარგად იმუშავა? იყო Blumenstock- ს შეუძლია კითხვების კითხვებზე პასუხის გაცემისთვის, როგორიცაა "თქვენ რადიოს რადიო?" და "გაქვთ ველოსიპედი?" მისი პროგნოზირების მოდელის შესრულების შესაფასებლად Blumenstock გამოიყენება ჯვარედინი გადამოწმების , მონაცემთა მეცნიერების საყოველთაოდ გამოყენებული ტექნიკა, მაგრამ იშვიათად სოციალურ მეცნიერებაში. ჯვარედინი გადამოწმების მიზანია მოამზადოს მოდელის პროგნოზირებადი ეფექტურობის შეფასება და გაარკვიოს იგი მონაცემთა სხვადასხვა სუბიექტზე. კერძოდ, Blumenstock- მა მისი მონაცემები 100-ზე მეტ 100-ში შეადგინა. შემდეგ, მან გამოიყენა ცხრა ნაწილაკი თავისი მოდელის შესამუშავებლად და მომზადებული მოდელის პროგნოზირებადი ეფექტი შეაფასა დანარჩენი ბლოკზე. მან ეს პროცედურა კიდევ ერთხელ გაიმეორა 10-ჯერზე, თითოეული მონაცემებით, რომელიც იღებს მონაცემების გადამოწმებას, როგორც გადამოწმების მონაცემებს და საშუალოდ შედეგებს.

წინასწარმეტყველებების სიზუსტე მაღალი იყო ზოგიერთი მახასიათებლისთვის (ფიგურა 3.14); მაგალითად, Blumenstock შეიძლება პროგნოზირება ერთად 97,6% სიზუსტით, თუ ვინმე კუთვნილი რადიო. ეს შეიძლება შთამბეჭდავი იყოს, მაგრამ ყოველთვის მნიშვნელოვანია რთული ალტერნატივის წინააღმდეგ კომპლექსური პროგნოზის მეთოდის შედარება. ამ შემთხვევაში, მარტივი ალტერნატივაა იმის პროგნოზირება, რომ ყველას მივცემთ ყველაზე გავრცელებულ პასუხს. მაგალითად, გამოკითხულთა 97.3% იტყობინებოდა, რომ ბუმუმსტოქის წინასწარმეტყველების თანახმად, ყველას, რომ რადიოზე ფლობდნენ, მას ჰქონდა 97,3% სიზუსტე, რაც საოცრად მსგავსია მისი უფრო რთული პროცედურის (97,6% სიზუსტით) . სხვა სიტყვებით რომ ვთქვათ, ყველა ხელსაყრელი მონაცემები და მოდელირება პროგნოზის სიზუსტე გაიზარდა 97.3% -დან 97.6% -მდე. თუმცა, სხვა კითხვებით, როგორიცაა "გაქვთ ველოსიპედი?", პროგნოზები გაუმჯობესდა 54.4% -დან 67.6% -მდე. უფრო ზოგადად, ფიგურა 3.15 გვიჩვენებს, რომ ზოგიერთი მახასიათებლებისთვის ბლუმენტოქმა არ გააუმჯობესა მხოლოდ მარტივი საბაზისო პროგნოზის გაკეთება, მაგრამ სხვა მახასიათებლებისთვის იყო გარკვეული გაუმჯობესება. ამ შედეგების მიღება მხოლოდ იმიტომ შეიძლება, რომ ეს მიდგომა განსაკუთრებით პერსპექტიულია.

ფიგურა 3.14: პროგნოზირებადი სიზუსტე სტატისტიკური მოდელით, რომელიც მომზადდა ზარის ჩანაწერებით. ადაპტირებული Blumenstock (2014), ცხრილი 2.

ფიგურა 3.14: პროგნოზირებადი სიზუსტე სტატისტიკური მოდელით, რომელიც მომზადდა ზარის ჩანაწერებით. ადაპტირებული Blumenstock (2014) , ცხრილი 2.

გრაფიკი 3.15: სტატისტიკური მოდელის პროგნოზირებადი სიზუსტის შედარება მარტივი საბაზისო პროგნოზით ზარის ჩანაწერებით მომზადებული. პუნქტები ოდნავ მწვავეა, რათა თავიდან იქნას აცილებული გადახურვა. ადაპტირებული Blumenstock (2014), ცხრილი 2.

გრაფიკი 3.15: სტატისტიკური მოდელის პროგნოზირებადი სიზუსტის შედარება მარტივი საბაზისო პროგნოზით ზარის ჩანაწერებით მომზადებული. პუნქტები ოდნავ მწვავეა, რათა თავიდან იქნას აცილებული გადახურვა. ადაპტირებული Blumenstock (2014) , ცხრილი 2.

თუმცა, ერთი წლის შემდეგ, ბლუმენტოკის და ორი კოლეგის, გაბრიელ კადამურო და რობერტ ონის გამოაქვეყნა ქაღალდი მეცნიერებაში არსებითად უკეთესი შედეგებით (Blumenstock, Cadamuro, and On 2015) . ამ გაუმჯობესების მიზნით ორი ძირითადი ტექნიკური მიზეზი იყო: 1) უფრო დახვეწილი მეთოდები იყენებდნენ (ანუ, ახალი მიდგომა, რომლებშიც გამოირჩეოდნენ საინჟინრო და უფრო დახვეწილი მოდელი, რათა განევითარებინათ რეაგირების მახასიათებლები) და (2) ვიდრე პიროვნებაზე რეაგირების მცდელობა კვლევის კითხვები (მაგ., "რადი ჰყავს რადიო?"), ისინი ცდილობდნენ შეესრულებინათ სიმდიდრის სიმდიდრე. ეს ტექნიკური გაუმჯობესება იმას ნიშნავდა, რომ მათ შეეძლოთ ზარის ჩანაწერების გონივრული სამუშაოს შესრულება, რათა ხალხის სიმდიდრის პროგნოზირება მოახდინონ.

თუმცა ნიმუშში ადამიანების სიმდიდრის პროგნოზირება კვლევის საბოლოო მიზანი არ იყო. გახსოვდეთ, რომ საბოლოო მიზანი იყო ნიმუშების კვლევებისა და აღწერის ზოგიერთი საუკეთესო თვისება, რათა წარმოედგინა განვითარებადი ქვეყნების სიღარიბის ზუსტი, მაღალი ხარისხის შეფასებები. ამ მიზნის მისაღწევად, ბლუმენტოკისა და კოლეგების მიერ მათი მოდელისა და მათი მონაცემების გამოყენებამ გამოიყენა ზარის ჩანაწერებში 1.5 მილიონი ადამიანის სიმდიდრის პროგნოზირება. ისინი იყენებდნენ ზარის ჩანაწერებში ჩართულ გეოსტატალურ ინფორმაციას (გაითვალისწინეთ, რომ მონაცემები მოიცავდა თითოეული ზარის უახლოეს საკანში მდებარე კოშკს), რათა დადგინდეს თითოეული ადამიანის საცხოვრებელი ადგილის სავარაუდო ადგილი (ფიგურა 3.17). ამ ორი შეფასების ერთად, ბლუმენტოკის და კოლეგებმა წარმოადგინეს საანგარიშო სიმდიდრის გეოგრაფიული განაწილების ხარჯთაღრიცხვა უზარმაზარი სივრცითი მარცვლოვნით. მაგალითად, მათ შეუძლიათ შეაფასონ საშუალო სიმდიდრე თითოეულ რუანდას 2,148 უჯრედში (ქვეყნის ყველაზე პატარა ადმინისტრაციული ერთეული).

რამდენად კარგად იყო შეფასებული ეს მაჩვენებლები ამ რეგიონებში სიღარიბის დონემდე? სანამ ამ კითხვას ვუპასუხებ, მინდა ხაზგასმით აღვნიშნო ის ფაქტი, რომ სკეპტიკურად არის ბევრი მიზეზი. მაგალითად, ინდივიდუალურ დონეზე წინასწარმეტყველების უნარი საკმაოდ ხმაურიანი იყო (ფიგურა 3.17). და, რაც უფრო მნიშვნელოვანია, მობილური ტელეფონების მქონე ადამიანები მობილური ტელეფონების გარეშე ადამიანებიდან სისტემურად განსხვავდებიან. ამდენად, Blumenstock და კოლეგებს შეიძლება განიცდიან ტიპის დაფარვის შეცდომები, რომ მიკერძოებული 1936 ლიტერატურული დაიჯესტი კვლევა, რომელიც მე ადრე აღწერილი.

მათი შეფასების ხარისხის მოსაპოვებლად, Blumenstock- მა და კოლეგებმა სხვებთან შედარების საჭიროა. საბედნიეროდ, დაახლოებით ერთსა და იმავე დროს სწავლობდა მკვლევარების კიდევ ერთი ჯგუფი რუანდაში ტრადიციული სოციალური კვლევის ჩატარებას. ეს სხვა კვლევა, რომელიც ფართოდ პატივცემული დემოგრაფიული და ჯანმრთელობის კვლევის პროგრამის ნაწილი იყო, დიდი ბიუჯეტი ჰქონდა და მაღალი ხარისხის, ტრადიციული მეთოდებით იყენებდა. აქედან გამომდინარე, დემოგრაფიული და ჯანმრთელობის კვლევის შეფასებები შეიძლება შეფასდეს ოქროს სტანდარტის შეფასებით. როდესაც ორი შეფასების შედარება, ისინი საკმაოდ მსგავსი (ფიგურა 3.17). სხვა სიტყვებით რომ ვთქვათ, მცირე რაოდენობის კვლევის მონაცემების ზარის ჩანაწერებით, ბლუმენტოკის და კოლეგებმა შეძლეს წარმოდგენა ოქროს სტანდარტების მიახლოებით.

სკეპტიკოსი შესაძლოა, ეს შედეგები იმედგაცრუებად მიიჩნიოს. ყოველივე ამის შემდეგ, ერთი გზა ნახვისა არის იმის თქმა, რომ გამოყენებით დიდი მონაცემები და მანქანა სწავლის, Blumenstock და კოლეგებს შეძლეს წარმოების შეფასებები, რომ შეიძლება უფრო საიმედოდ უკვე არსებული მეთოდები. მაგრამ მე არ ვფიქრობ, რომ ეს არის სწორი გზა ამ კვლევის შესახებ ორი მიზეზის გამო. პირველ რიგში, ბლუმენტოკისა და კოლეგების შეფასებები დაახლოებით 10-ჯერ უფრო სწრაფად და 50-ჯერ უფრო იაფია (როდესაც ღირებულება ფასდება ცვლად ხარჯებში). როგორც ამ თავში ადრე ვამბობდი, მკვლევარები იგნორირებას უკეთებენ თავიანთ საფრთხეს. ამ შემთხვევაში, მაგალითად, ხარჯების დრამატული შემცირება იმას ნიშნავს, რომ ყოველ რამდენიმე წელიწადში ერთხელ არ იმოქმედებს, როგორც დემოგრაფიული და ჯანმრთელობის კვლევების სტანდარტი - ამგვარი კვლევა ყოველთვიურად შეიძლება ჩატარდეს, რაც მკვლევარებისა და პოლიტიკის მრავალ უპირატესობას უზრუნველყოფს შემქმნელები. მეორე მიზეზი, რომ არ მიიღოს სკეპტიკური თვალსაზრისით, არის ის, რომ ეს კვლევა ითვალისწინებს ძირითად რეცეპტს, რომელიც შეიძლება მორგებული იყოს მრავალ სხვადასხვა კვლევაში. ეს რეცეპტი აქვს მხოლოდ ორი ინგრედიენტი და ორი ნაბიჯი. ინგრედიენტები არის (1) დიდი მონაცემთა წყარო, რომელიც არის ფართო მაგრამ თხელი (ანუ ბევრი ადამიანია, მაგრამ არა ინფორმაცია, რომლითაც გჭირდებათ თითოეული ადამიანი) და (2) კვლევა, რომელიც არის ვიწრო, მაგრამ სქელი (ანუ რამდენიმე ადამიანი, მაგრამ მას აქვს ინფორმაცია, რომ საჭიროა იმ ადამიანებზე). ეს ინგრედიენტები შემდგომში ორი ნაბიჯით არის შერწყმული. პირველ რიგში, ორივე მონაცემთა ბაზაში ადამიანები, აშენება მანქანა სწავლის მოდელი, რომელიც იყენებს დიდი მონაცემთა წყაროს გამოკითხვის პასუხების პროგნოზით. შემდეგ, გამოიყენეთ ეს მოდელი, რომელიც მიანიშნებს კვლევის პასუხებს ყველასთვის დიდი მონაცემთა წყაროში. ამდენად, თუ არსებობს რაიმე შეკითხვა, რომ თქვენ გინდათ ბევრი ადამიანი სთხოვოთ, ეძებოთ დიდი მონაცემთა წყარო იმ ადამიანებისგან, რომლებიც შეიძლება გამოყენებულ იქნეს მათი პასუხის პროგნოზირებისთვის, მაშინაც კი, თუ არ აინტერესებთ დიდი მონაცემთა წყაროდან . ანუ, Blumenstock და კოლეგებს არ არსებითად ზრუნავს ზარის ჩანაწერები; ისინი მხოლოდ ზარის ჩანაწერებზე ზრუნავდნენ, რადგან ისინი შეიძლება გამოეყენებინა კვლევის პასუხების პროგნოზირება, რომ ისინი ზრუნავდნენ. ეს დამახასიათებელი მხოლოდ ირიბი ინტერესი დიდი მონაცემთა წყაროა, რაც გაძლიერებულია და ითხოვს განსხვავებულ მოთხოვნებს, რომელიც ადრე აღწერილია.

ფიგურა 3.16: სწავლის სქემატური ბლუმენტოკის, კადრუმუსისა და On (2015). სატელეფონო კომპანიიდან ზარის ჩანაწერები გადაიყვანეს მატრიცაზე თითო გრაფთან თითოეული ადამიანისა და ერთი სვეტისთვის თითოეული ფუნქციისათვის (მაგ. ცვლადი). შემდეგი, მკვლევარებმა ააშენეს ზედამხედველობითი სწავლის მოდელი, რომელიც გამოკითხვის შედეგების პროგნოზირებას ახდენს პირის მიერ სპეციფიური მატრიცისგან. ამის შემდეგ, მეთვალყურეობის მეთოდები გამოყენებული იქნა 1.5 მილიონზე მეტმა მომხმარებელმა გამოკითხვის პასუხებზე. გარდა ამისა, მკვლევარებმა შეაფასეს სავარაუდო საცხოვრებელი ადგილი ყველა 1.5 მილიონი აბონენტისთვის, მათი ადგილმდებარეობის მიხედვით. როდესაც ეს ორი შეფასება - სავარაუდო სიმდიდრე და საცხოვრებელი ადგილის სავარაუდო ადგილი - კომბინირებული იყო, შედეგები შეფასდა დემოგრაფიული და ჯანმრთელობის კვლევისაგან, ოქროს სტანდარტის ტრადიციული კვლევა (ფიგურა 3.17).

ფიგურა 3.16: სწავლის სქემატური Blumenstock, Cadamuro, and On (2015) . ტელეფონიდან სატელეფონო ჩანაწერების ჩანაწერები გადაიყვანეს მატრიცაზე თითოეული რიგისთვის ერთი რიგისა და ერთი სვეტისთვის თითოეული ფუნქციისთვის (ანუ ცვლადი). შემდეგი, მკვლევარებმა ააშენეს ზედამხედველობითი სწავლის მოდელი, რომელიც გამოკითხვის შედეგების პროგნოზირებას ახდენს პირის მიერ სპეციფიური მატრიცისგან. ამის შემდეგ, მეთვალყურეობის მეთოდები გამოყენებული იქნა 1.5 მილიონზე მეტმა მომხმარებელმა გამოკითხვის პასუხებზე. გარდა ამისა, მკვლევარებმა შეაფასეს სავარაუდო საცხოვრებელი ადგილი ყველა 1.5 მილიონი აბონენტისთვის, მათი ადგილმდებარეობის მიხედვით. როდესაც ეს ორი შეფასება - სავარაუდო სიმდიდრე და საცხოვრებელი ადგილის სავარაუდო ადგილი - კომბინირებული იყო, შედეგები შეფასდა დემოგრაფიული და ჯანმრთელობის კვლევისაგან, ოქროს სტანდარტის ტრადიციული კვლევა (ფიგურა 3.17).

ფიგურა 3.17: შედეგები Blumenstock, Cadamuro და On (2015). ინდივიდუალურ დონეზე, მკვლევარებმა შეძლეს გონივრული სამუშაოს შესრულება, ვისთანაც ვინმეს სიმდიდრე წინასწარმეტყველებდა. რუანდას 30 რაიონის რაიონული დონის სიმდიდრის შეფასებები, რომლებიც ეფუძნებოდა სიმდიდრისა და საცხოვრებელი ადგილის ინდივიდუალურ შეფასებას, იყო მსგავსი დემოგრაფიული და ჯანმრთელობის კვლევის შედეგები, ოქროს სტანდარტების ტრადიციული კვლევა. ადაპტირებული Blumenstock, Cadamuro და On (2015), ციფრები 1a და 3c.

ფიგურა 3.17: შედეგები Blumenstock, Cadamuro, and On (2015) . ინდივიდუალურ დონეზე, მკვლევარებმა შეძლეს გონივრული სამუშაოს შესრულება, ვისთანაც ვინმეს სიმდიდრე წინასწარმეტყველებდა. რუანდას 30 რაიონის რაიონული დონის სიმდიდრის შეფასებები, რომლებიც ეფუძნებოდა სიმდიდრისა და საცხოვრებელი ადგილის ინდივიდუალურ შეფასებას, იყო მსგავსი დემოგრაფიული და ჯანმრთელობის კვლევის შედეგები, ოქროს სტანდარტების ტრადიციული კვლევა. ადაპტირებული Blumenstock, Cadamuro, and On (2015) , ციფრები 1a და 3c.

საბოლოო ჯამში, Blumenstock- ის გაძლიერებული სთხოვა მიდგომა შერწყმულია გამოკითხვა მონაცემთა დიდი მონაცემთა წყარო, რათა წარმოადგინოს შეფასებები, რომლებიც შედარებით იმ ოქროს სტანდარტის კვლევა. ამ კონკრეტულ მაგალითს ასევე გარკვეულწილად განმარტავს გაღრმავებული გეკითხებით და ტრადიციული მეთოდების გამოყენებით. გაძლიერებული სათხოვნეობრივი შეფასებები უფრო დროული, არსებითად იაფი და უფრო მარცვლოვანი იყო. მაგრამ, მეორეს მხრივ, ჯერ კიდევ არ არის ძლიერი თეორიული საფუძველი ამგვარი გააქტიურების შესახებ. ეს მაგალითი არ აჩვენებს, როდესაც ეს მიდგომა იმუშავებს და როდესაც ეს არ მოხდება და მკვლევარები ამ მიდგომის გამოყენებით განსაკუთრებულად შეშფოთებულნი უნდა იყვნენ იმ შესაძლო ფაქტორებზე, რომლებიც გამოწვეულია და ვინ არ შედის მათი დიდი მონაცემთა წყაროში. გარდა ამისა, გამარტივებულმა მოსმენამ მიდგომა ჯერ კიდევ არ არის კარგი გზები მის შეფასების ირგვლივ გაურკვევლობაში. საბედნიეროდ, ითხოვს ითხოვს ღრმა კავშირები სტატისტიკასა და მცირე ზომის შეფასებისას (Rao and Molina 2015) , imputation (Rubin 2004) და მოდელზე დაფუძნებულ პოსტ-სტრატიფიკაციაში (რაც თავის მხრივ მჭიდრო კავშირშია ბატონ პ. მეთოდი, რომელიც აღწერილია ადრე თავი) (Little 1993) . ამ ღრმა კავშირების გამო ვიმედოვნებ, რომ მალე გაუმჯობესებული მეთოდოლოგიური საფუძვლები მალე გაუმჯობესდება.

საბოლოოდ, Blumenstock- ის პირველი და მეორე მცდელობების შედარებით მნიშვნელოვანი მაგალითია ციფრული ასაკობრივი სოციალური კვლევის შესახებ: დასაწყისი არ არის დასასრული. ეს არის არაერთი, პირველი მიდგომა არ იქნება საუკეთესო, მაგრამ თუ მკვლევარებმა გააგრძელებენ მუშაობას, ყველაფერი უკეთესობისკენ მიდის. უფრო ზოგადად, სოციალური კვლევის ახალი მიდგომების შეფასებისას ციფრულ ასაკში მნიშვნელოვანია ორი განსხვავებული შეფასების გაკეთება: (1) რამდენად კარგად მუშაობს ეს სამუშაო? (2) რამდენად კარგად იქნება ეს სამუშაო მომავალში, როგორც მონაცემები ლანდშაფტის ცვლილებები და, როგორც მკვლევარებმა მეტი ყურადღება დაუთმეს პრობლემას? მიუხედავად იმისა, რომ მკვლევართა მომზადება, რათა პირველი სახის შეფასების, მეორე უფრო მნიშვნელოვანია.