3.6.1 Amplified dotazem

Propojením průzkum na digitální stopy může být jako ptát každému Vaše otázky po celou dobu.

Kladení obecně vejde do dvou hlavních kategorií: výběrových šetření a sčítání lidu. S výběrovými šetřeními, kde si přístup malý počet lidí, může být flexibilní, včasné a relativně levná. Nicméně, výběrových šetření, protože jsou založeny na vzorku, jsou často omezeny ve svém usnesení; s výběrovým šetřením, je často těžké, aby se odhady o konkrétních geografických oblastech nebo pro specifické demografické skupiny. Sčítání lidu, na druhé straně pokus o rozhovor každého v populaci. Mají velké rozlišení, ale oni jsou obecně dražší, úzký v centru pozornosti (jsou mezi nimi jen malý počet otázek), a nikoli včas (k nim dochází na stanoveného harmonogramu, jako je například každých 10 let) (Kish 1979) . A teď si představte, že výzkumní pracovníci mohli kombinovat nejlepší vlastnosti výběrových šetření a sčítání; Představte si, že výzkumní pracovníci mohli každý den ptát na každou otázku pro každého.

Je zřejmé, že toto neustálé, všudypřítomné, trvalé připojení k průzkumu je druh fantazie společenských věd. Ale, zdá se, že můžeme začít přiblížit to tím, že kombinuje průzkumové z malého počtu osob s digitálními stopami z mnoha lidí. Říkám tento typ kombinace zesílen ptát. Pokud se to udělá dobře, mohlo by to pomoci nám poskytuje odhad, které jsou větší lokální (u menších zeměpisných oblastech), více zrnitý (pro konkrétní demografické skupiny), a včasnější.

Jedním z příkladů zesíleného ptát pochází z práce Joshua Blumenstock, který chtěl shromáždit údaje, které by pomohly rozvoji manuál v chudých zemích. Přesněji řečeno, Blumenstock chtěl vytvořit systém pro měření bohatství a blahobyt, který v kombinaci úplnost sčítání s flexibilitou a četnosti průzkumu (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . Ve skutečnosti jsem už popsal Blumenstock práci stručně v kapitole 1.

Chcete-li začít, Blumenstock spolupracuje s největším poskytovatelem mobilních telefonů ve Rwandě. Společnost mu poskytnuty anonymních záznamů o transakcích od asi 1,5 milionu zákazníků pokrývajících chování v letech 2005 a 2009. Protokoly obsahují informace o každém volání a textové zprávy, jako je čas zahájení, trvání a přibližné zeměpisné poloze volajícího a přijímačem. Než začneme mluvit o statistických otázek, je třeba zdůraznit, že tento první krok může být jedním z nejtěžších. Jak je popsáno v kapitole 2, většina digitální stopa nemá přístup k údajům výzkumným pracovníkům. A mnoho firem jsou oprávněně váhají sdílet svá data, protože je soukromé; že je jejich zákazníci zřejmě nečekala, že jejich záznamy budou sdíleny-in hromadně s výzkumnými pracovníky. V tomto případě výzkumníci vzali opatrné kroky k anonymizovat dat a jejich práce byla pod dohledem třetí stranou (tj jejich IRB). Ale navzdory těmto snahám, tyto údaje jsou pravděpodobně stále identifikovatelné a budou pravděpodobně obsahovat citlivé informace (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Vrátím se na tyto etické otázky v kapitole 6.

Připomeňme si, že Blumenstock se zajímal o měření bohatství a blahobyt. Ale tyto vlastnosti nejsou přímo v záznamech volání. Jinými slovy, tyto záznamy hovorů jsou neúplné pro tento výzkum, společný rys digitálních stop, které byly podrobně projednány v kapitole 2. Ale zdá se pravděpodobné, že tyto záznamy volání pravděpodobně mít nějaké informace o bohatství a blahobytu. Takže jeden způsob kladení Blumenstock otázka by mohla být: je to možné předpovědět, jak se někdo bude reagovat na průzkum na základě jejich digitální data trasování? Pokud ano, pak tím, že žádá několik lidí, můžeme odhadnout odpovědi na všechny ostatní.

Chcete-li to posoudit empiricky, Blumenstock a pomocní výzkumní pracovníci z Kigali Institute of Science and Technology nazývá vzorek asi tisíc zákazníků mobilních telefonů. Výzkumníci vysvětlil cíle projektu na účastníky, požádal o jejich souhlasu, aby propojila odezvy průzkumu záznamy volání, a pak se zeptal jim několik otázek, které měří jejich bohatství a blahobytu, jako je například "Vlastníte rádio? "a" máte vlastní kolo? "(viz obrázek 3.11 pro částečný seznam). Všichni účastníci průzkumu byly kompenzovány finančně.

Dále Blumenstock použit dvoustupňový postup společný Údaje o vědě: rysem technicko-následovat učení s učitelem. Za prvé, v funkce inženýrské kroku, pro každého, aby byl dotazován, Blumenstock převedeny záznamy hovorů do souboru charakteristik asi každého člověka; datové vědci mohli nazvat tyto charakteristiky "funkce" a sociální vědci jim říkají "proměnné". Například pro každou osobu, Blumenstock vypočítá celkový počet dnů s aktivitou, počet různých lidí osoba byla v kontaktu s, částka peněz vynaložených na hovorné, a tak dále. Kriticky, dobrá vlastnost inženýrství vyžaduje znalosti o výzkumném prostředí. Například, pokud je důležité rozlišovat mezi domácí a mezinárodní hovory (můžeme očekávat, že lidé, kteří volají mezinárodně být bohatější), pak to musí být provedeno do funkce inženýrské kroku. Výzkumník s malým pochopením Rwandy nemusí obsahovat tuto funkci, a pak prediktivní výkon modelu bude trpět.

Dále na hlídaném učení kroku Blumenstock postavený statistický model k predikci odezvy průzkumu pro každou osobu na základě svých funkcí. V tomto případě se používá Blumenstock logistické regrese s 10-násobným křížové validace, ale mohl použít celou řadu dalších statistických nebo stroj přístup ke studiu.

Tak, jak dobře to funguje? Byl Blumenstock schopen předpovědět odpovědi na průzkum otázky typu "Vlastníte rádio?" A "Máte vlastní kolo?" Pomocí funkce odvozené ze záznamů hovorů? Tak nějak. Přesnost předpovědí byly vysoké pro některé znaky (obrázek 3.11). Ale, že je vždy nutné porovnávat komplexní metody predikce proti prosté varianty. V tomto případě je jednoduchá alternativa je předpovědět, že každý dá nejběžnější odpověď. Například 97,3% uvedlo vlastnit rádia, takže pokud Blumenstock mu předpověděl, že každý by nahlásit vlastní rádio by měli přesnost 97,3%, což je překvapivě podobný výkonu své složitějšího postupu (97,6% přesnost). Jinými slovy, všechny údaje fantazie a modelování zvýšila přesnost předpovědi z 97,3% na 97,6%. Nicméně, pro další otázky, jako je například "Máte vlastní kolo?", Předpovědi se zlepšil z 54,4% na 67,6%. Obecněji řečeno, obrázek 3.12 ukazuje na některé rysy Blumenstock nezlepšila mnohem více než jen dělat jednoduché základní predikci, ale že pro jiné zvláštnosti došlo k určitému zlepšení.

Obrázek 3.11: Prediktivní přesnost statistického modelu vyškolený se záznamy hovorů. Výsledky z tabulky 2 Blumenstock (2014).

Obrázek 3.11: Prediktivní přesnost statistického modelu vyškolený se záznamy hovorů. Výsledky z tabulky 2 Blumenstock (2014) .

Obrázek 3.12: Porovnání prediktivní přesnosti pro statistického modelu trénoval s volání záznamů na jednoduchém základním předpovědi. Body jsou mírně jittered aby se zabránilo překrývání; viz tabulka 2 Blumenstock (2014) pro přesné hodnoty.

Obrázek 3.12: Porovnání prediktivní přesnosti pro statistického modelu trénoval s volání záznamů na jednoduchém základním předpovědi. Body jsou mírně jittered aby se zabránilo překrývání; viz tabulka 2 Blumenstock (2014) pro přesné hodnoty.

V tomto okamžiku byste mohli myslet, že tyto výsledky jsou trochu zklamáním, ale jen o rok později, Blumenstock a dva kolegové-Gabriel Cadamuro a Robert On-publikoval článek v časopise Science s podstatně lepšími výsledky (Blumenstock, Cadamuro, and On 2015) , Byly tam dva hlavní technické důvody pro zlepšení: 1), kterou použili více sofistikované metody (tj nový přístup k rysu inženýrství a sofistikovanější učení modelu počítače) a 2), spíše než se pokoušet odvodit odpovědi na jednotlivé otázky průzkumu (např "máte vlastní rádio?"), se pokusili odvodit složený index bohatství.

Blumenstock a kolegové demonstroval výkonnost jejich přístup dvěma způsoby. Za prvé, zjistili, že pro lidi v jejich vzorku mohli udělat docela dobrou práci prognózování jejich bohatství ze záznamů volání (obr 3.14). Za druhé, a stále je ještě důležitější, Blumenstock a jeho kolegové ukázali, že jejich postup by mohl produkovat vysoce kvalitní odhady geografického rozdělení bohatství ve Rwandě. Přesněji řečeno, oni používali jejich Machine Learning model, který byl vyškolen na jejich vzorku asi 1000 lidí, předpovídat bohatství všech 1,5 milionu lidí v záznamech volání. Dále, s geoprostorových dat vložených v datech volání (připomeňme, že data volání zahrnuje umístění nejbližšího buněk věž pro každý hovor), výzkumníci byli schopni odhadnout přibližnou bydliště každého člověka. Uvedení těchto dvou odhadů dohromady, výzkum produkoval odhad geografické rozložení účastnické bohatství na extrémně jemné prostorové zrnitosti. Například, mohou odhadnout průměrnou bohatství v každé z 2148 buněk Rwandy (nejmenší administrativní jednotky v zemi). Tyto předpovězené hodnoty bohatství bylo tak zrnitý, že bylo obtížné zkontrolovat. Takže, výzkumníci agregované výsledky své práce, aby vypracovala odhady průměrného bohatství rwandské 30 okresů. Tyto odhady okresní úrovni byly úzce souvisí s odhady ze zlatého standardu tradičním průzkumu, rwandská Demografické a Health Survey (obrázek 3.14). Přestože odhady ze dvou zdrojů byly podobné, odhady z Blumenstock a jeho kolegové bylo asi 50 krát levnější a 10krát rychlejší (pokud náklady na měřené z hlediska variabilních nákladů). Tento dramatický pokles nákladů znamená, že spíše než aby byla jezdí každých několik let, což je standard pro demografické a zdravotní průzkumy-hybridní malého průzkumu v kombinaci s velkými digitálními stopovými údajů by mohlo být spuštěn každý měsíc.

Obrázek 3.13: Schéma Blumenstock, Cadamuro, a On (2015). Datové volání z telefonní společnosti byl převeden do matice s jeden řádek pro každou osobu a jeden sloupec pro každou funkci (tj variabilní). Dále výzkumníci postavena dozorovaného modelu učení předpovídat odpovědí v průzkumu z osobě funkcí matrice. Poté, supervizovaná studijní model byl použit přičetla odpovědi průzkum pro každého. V podstatě lze říci, použili vědci odezvy asi tisíc lidí přičítat bohatství asi milion lidí. Také vědci odhadli přibližné místo pobytu všech 1,5 milionu lidí na základě umístění svých hovorů. Když byly tyto dva odhady kombinovaným odhadovaný bohatství a odhadovaný místa bydliště, výsledkem byly podobné odhady z demografické a zdravotní průzkumu, zlatý standard tradičního průzkumu (viz obrázek 3.14).

Obrázek 3.13: Schéma Blumenstock, Cadamuro, and On (2015) . Datové volání z telefonní společnosti byl převeden do matice s jeden řádek pro každou osobu a jeden sloupec pro každou funkci (tj variabilní). Dále výzkumníci postavena dozorovaného modelu učení předpovídat odpovědí v průzkumu z osobě funkcí matrice. Poté, supervizovaná studijní model byl použit přičetla odpovědi průzkum pro každého. V podstatě lze říci, použili vědci odezvy asi tisíc lidí přičítat bohatství asi milion lidí. Také vědci odhadli přibližné místo pobytu všech 1,5 milionu lidí na základě umístění svých hovorů. Když byly tyto dva odhady kombinovaným odhadovaný bohatství a odhadovaný místa bydliště, výsledkem byly podobné odhady z demografické a zdravotní průzkumu, zlatý standard tradičního průzkumu (viz obrázek 3.14).

Obrázek 3.14: Výsledky Blumenstock, Cadamuro a na (2015). Na individuální úrovni, vědci byli schopni udělat rozumnou práci v předpovídání něčí bohatství ze svých záznamů hovorů. Odhady okresní úrovně bohatství, které byly na základě odhadů na individuální úrovni bohatství a místa bydliště-byly výsledky podobné výsledkům z demografické a zdravotní Survey, se zlatým standardem tradičního průzkumu.

Obrázek 3.14: Výsledky Blumenstock, Cadamuro, and On (2015) . Na individuální úrovni, vědci byli schopni udělat rozumnou práci v předpovídání něčí bohatství ze svých záznamů hovorů. Odhady okresní úrovně bohatství, které byly na základě odhadů na individuální úrovni bohatství a místa bydliště-byly výsledky podobné výsledkům z demografické a zdravotní Survey, se zlatým standardem tradičního průzkumu.

Závěrem lze říci, Blumenstock je zesílen žádá přístup v kombinaci údajů zjištěných s digitálními data trasování, aby vypracovala odhady srovnatelné s odhady průzkumu zlatý standard. Tento konkrétní příklad také objasňuje některé z kompromisů mezi zesíleného ptát a tradičních metod průzkumu. Za prvé, amplifikované žádají odhady byly včasnější, podstatně levnější a přesnější. Ale na druhé straně, v této době, není silná teoretický základ pro tento druh zesíleného ptát. To znamená, že tento příklad neukazuje, když to bude fungovat, a když to nebude. Dále je zesílen požadovaná přístup ještě nemá dobré způsoby, jak kvantifikovat nejistotu panující kolem jejích odhadů. Nicméně, zesílen požadovaná má hluboké spojení do tří velkých oblastí ve statistice model na bázi po stratifikaci (Little 1993) , dopočtových (Rubin 2004) , a odhadu malých prostor (Rao and Molina 2015) -a, takže předpokládám, že pokrok bude být rychlý.

Zesílen požadovaná následuje základní recept, který lze přizpůsobit konkrétní situaci. Existují dvě složky a dva kroky. Tyto dvě složky jsou: 1) digitální stopa datová sada, která je široká, ale tenká (to znamená, že má mnoho lidí, ale nikoli informace, které potřebujete o jednotlivých osob) a 2) průzkum, který je úzký, ale silná (to znamená, že má jen málo lidí, ale má informace, které potřebujete o těch lidech). Pak existují dva kroky. Za prvé, pokud jde o lidi v obou datových zdrojů, stavět učení modelu stroj, který používá digitální data trasování předvídat průzkumu odpovědí. Dále použijte tento model strojového učení přičítat průzkumů odpovědi každého na digitální data trasování. Takže pokud tam je nějaká otázka, na kterou se chcete zeptat na spoustu lidí, podívejte se na digitální data trasování z těch lidí, které by mohly být použity k predikci jejich odpověď.

Porovnáním Blumenstock první a druhý pokus na problém ilustruje také důležitý poznatek o přechodu z druhého éry k přístupu třetích éry průzkumu výzkumu: začátek není konec. To znamená, že mnohokrát, první přístup nebude nejlepší, ale pokud výzkumníci pokračují v práci, mohou se věci lépe. Obecněji řečeno, při posuzování nové přístupy k sociálním výzkumu v digitálním věku, je důležité, aby se dva rozdílné hodnocení: 1), jak dobře to funguje nyní a 2) jak dobře si myslíte, že by to mohlo fungovat v budoucnosti jako datový krajiny změny a jako výzkumní pracovníci věnovat více pozornosti k problému. I když výzkumníci jsou školeni, aby se první druh evaluace (jak dobrý je tento konkrétní kus výzkumu), druhý je často důležitější.