3.6.1 Amplified pedindo

Ligando súa enquisa aos restos dixitais pode ser como pedindo a todos as súas preguntas en todo momento.

Pedindo xeralmente vén en dúas categorías principais: as enquisas por mostraxe e recenseamento. enquisas por mostraxe, onde accede un pequeno número de persoas, pode ser flexible, oportuna e relativamente barato. Con todo, investigacións por mostraxe, porque están baseados nunha mostra, son moitas veces limitados na súa resolución; con unha enquisa por mostraxe, é moitas veces difícil de facer estimacións sobre rexións xeográficas específicas ou para grupos demográficos específicos. Censos, por outra, tratar entrevistar todos na poboación. Teñen boa resolución, pero son xeralmente caros, estreito en foco (que inclúen só un pequeno número de preguntas), e non oportuna (acontecen nun horario fixo, como cada 10 anos) (Kish 1979) . Imaxina se os investigadores poden combinar as mellores características de enquisas por mostraxe e censos; Imaxina se os investigadores puidesen facer as preguntas a todos cada día.

Obviamente, esta continua, omnipresente, sempre-en investigación é unha especie de fantasía científica social. Pero parece que podemos comezar a achegar iso combinando preguntas da investigación a partir dun pequeno número de persoas con trazos dixitais de moitas persoas. Eu chamo este tipo de combinación amplificado preguntar. Se ben feito, podería axudar nos ofrece estimación de que son máis local (a zonas xeográficas menores), máis granular (para grupos demográficos específicos), e máis oportuna.

Un exemplo de preguntar amplificado vén do traballo de Josué Blumenstock, que quería recoller datos que poderían axudar a guiar o desenvolvemento nos países pobres. En concreto, Blumenstock quería crear un sistema para medir a riqueza e benestar que combinaba a integralidade dun censo coa flexibilidade e frecuencia dunha enquisa (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . En realidade, eu xa describiu o traballo de Blumenstock brevemente no Capítulo 1.

Para comezar, Blumenstock colaboración coa maior operadora de telefonía móbil no Ruanda. A empresa deu-lle rexistros de transaccións anónimas de preto de 1,5 millóns de clientes, cubrindo comportamento entre 2005 e 2009. Os rexistros conteñen información sobre cada mensaxe de chamada e de texto, como a hora de inicio, duración e localización xeográfica aproximada do interlocutor eo receptor. Antes de comezar a falar sobre as cuestións estatísticas, é importante resaltar que este primeiro paso pode ser unha das máis difíciles. Conforme descrito no capítulo 2, a maioría de datos de seguimento dixital é inaccesible aos investigadores. E, moitas empresas están justificadamente hesitantes en compartir os seus datos, porque é privado; é dicir os seus clientes probablemente non esperaba que os seus rexistros serán compartidos-in bulk-con investigadores. Neste caso, os investigadores tomaron medidas coidadosas para Anonymize os datos eo seu traballo foi supervisado por un terceiro (ou sexa, a súa IRB). Pero, a pesar destes esforzos, estes datos son probablemente aínda identificables e probablemente conterán información sensibles (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . I volverá a estes cuestión ética no Capítulo 6.

Lembre que Blumenstock estaba interesado en medir a riqueza e benestar. Pero esas características non son directamente nos rexistros de chamadas. Noutras palabras, estes rexistros de chamadas son incompletos para esta procura, unha característica común dos vestixios dixitais que foi discutido en detalle no capítulo 2. Pero parece probable que os rexistros de chamadas probablemente ten algunha información sobre a riqueza e benestar. Así, unha forma de pedir a pregunta de Blumenstock podería ser: é posible prever como alguén vai responder a unha enquisa con base nos seus datos de seguimento dixital? Se é así, entón, pedindo algunhas persoas que poden adiviñar as respostas de todos os outros.

Para avaliar esta empíricamente, Blumenstock e asistentes de investigación de Kigali Institute of Science and Technology chamado dunha mostra de preto de mil clientes de telefonía móbil. Os investigadores explicaron os obxectivos do proxecto para os participantes, pediu o seu consentimento para conectar as respostas á enquisa aos rexistros de chamadas e, a continuación, pediulles unha serie de preguntas para medir a súa riqueza e benestar, como "Ten un radio? "e" ten unha bicicleta? "(ver a figura 3.11 para obter unha lista parcial). Todos os participantes da investigación foron compensados ​​económicamente.

Logo Blumenstock utilizado un procedemento de dúas etapas común na ciencia de datos: enxeñaría recurso seguido aprendizaxe supervisado. En primeiro lugar, no paso de enxeñaría recurso, para todos os que foi entrevistado, Blumenstock converteuse os rexistros de chamadas en un conxunto de características sobre cada persoa; científicos de datos pode chamar esas características "características" e os científicos sociais chámanlles "variables". Por exemplo, para cada persoa, Blumenstock calculada número total de días con actividade, o número de persoas distintas que unha persoa estea en contacto co, a cantidade de diñeiro gastado en tempo de antena, e así por diante. Criticamente, boa enxeñaría recurso require coñecemento do ámbito de investigación. Por exemplo, se é importante distinguir entre chamadas nacionais e internacionais (podemos esperar que as persoas que chaman a nivel internacional a ser máis ricos), entón iso debe ser feito no paso de enxeñaría recurso. Un investigador con pouca comprensión do Ruanda pode non incluír este recurso e, a continuación, a actuación de previsión do modelo pode sufrir.

A continuación, na etapa de aprendizaxe supervisada, Blumenstock construíu un modelo estatístico para prever a resposta de investigación para cada persoa en base ás súas características. Neste caso, Blumenstock utilizada a regresión loxística con 10 veces de validación cruzada, pero podería usar unha variedade de outras abordaxes de aprendizaxe estatística ou á máquina.

Entón, como é que funciona? Blumenstock soubo prever as respostas ás preguntas da investigación como "Ten un radio?" E "Ten un bicicleta?" Usando recursos derivados de rexistros de chamadas? Máis ou menos. A precisión das previsións foron elevados para algúns trazos (Figura 3.11). Pero sempre é importante comparar un método de predición complexa contra unha alternativa simple. Neste caso, unha alternativa simple é de prever que todos van dar a resposta máis común. Por exemplo, 97,3% informaron posuír un radio para Blumenstock previu que todos ían informar posuír un radio, el tería unha precisión de 97,3%, o que é sorprendente parecido ao desempeño do seu procedemento máis complexo (97,6% de precisión). Noutras palabras, todos os datos de fantasía e modelaxe aumentada a precisión da predicción desde 97,3% para 97,6%. Con todo, a outras cuestións, tales como "Ten unha bicicleta?", As previsións mellorou de 54,4% para 67,6%. De xeito máis xeral, a Figura 3.12 mostra a algúns trazos Blumenstock non mellorou moito máis alá de só facer a previsión de liña de base simple, pero que, para outros trazos houbo algunha mellora.

Figura 3.11: acurácia preditiva para modelo estatístico adestrado con rexistros de chamadas. Resultados do Cadro 2 do Blumenstock (2014).

Figura 3.11: acurácia preditiva para modelo estatístico adestrado con rexistros de chamadas. Resultados do Cadro 2 do Blumenstock (2014) .

Figura 3.12: Comparación de precisión da previsión para o modelo estatístico adestrado con rexistros de chamadas a previsión de liña de base simple. Os puntos son lixeiramente axitou a evitar solapes; ver cadro 2 do Blumenstock (2014) para valores exactos.

Figura 3.12: Comparación de precisión da previsión para o modelo estatístico adestrado con rexistros de chamadas a previsión de liña de base simple. Os puntos son lixeiramente axitou a evitar solapes; ver cadro 2 do Blumenstock (2014) para valores exactos.

Neste punto, pode estar pensando que estes resultados son un pouco decepcionante, pero só un ano máis tarde, Blumenstock e dous compañeiros-Gabriel Cadamuro e Robert En publicou un artigo na revista Science con substancialmente mellores resultados (Blumenstock, Cadamuro, and On 2015) . Había dúas razóns principais técnicas para a mellora: 1) utilizaban métodos máis sofisticados (é dicir, unha nova visión para caracterizar Enxeñería e un modelo de aprendizaxe de máquina máis sofisticada) e 2) en vez de tratar inferir respostas a preguntas de investigación individuais (por exemplo, "tes un radio?"), intentaron inferir un índice de riqueza composto.

Blumenstock e compañeiros demostraron o desempeño da súa visión de dous xeitos. En primeiro lugar, eles descubriron que, para as persoas na súa mostra, que poderían facer un traballo moi bo de prever a súa riqueza a partir de rexistros de chamadas (Figura 3.14). En segundo lugar, e cada vez máis importante, Blumenstock e compañeiros demostraron que o procedemento podería producir estimacións da distribución xeográfica da riqueza en Ruanda de alta calidade. En concreto, utilizaban o seu modelo de aprendizaxe de máquina, que foi adestrado na súa mostra de preto de 1.000 persoas, para prever a riqueza de todo 1,5 millóns de persoas nos rexistros de chamadas. Ademais, os datos xeoespaciais embutidos nos datos da chamada (lembre que os datos de chamadas inclúe a localización da torre de móbil máis próxima para cada chamada), os investigadores foron capaces de estimar o lugar aproximado de residencia de cada persoa. Poñer estas dúas estimacións xuntos, a investigación produciu unha estimación da distribución xeográfica da riqueza asinante no granularidade espacial moi fina. Por exemplo, eles poderían estimar a riqueza media en cada unha das células de Ruanda de 2148 (a menor unidade administrativa do país). Estes valores riqueza previstos eran tan granular eran difíciles de comprobar. Así, os investigadores agregados os resultados para que estimacións da riqueza media dos 30 distritos de Ruanda. Estas estimacións a nivel provincial foron fortemente relacionadas coas estimacións dunha investigación tradicional patrón ouro, o Enquisa Demográfico e de Saúde de Ruanda (Figura 3.14). Aínda que as estimacións das dúas fontes foron similares, as estimacións de Blumenstock e os seus compañeiros foron preto de 50 veces máis barato e 10 veces máis rápido (cando o custo na medida en termos de custos variables). Esta diminución drástica do custo significa que en vez de ser executado cada poucos anos, como é estándar para demográficos e de Saúde Enquisas o híbrido de pequeno levantamento quedar grandes datos de seguimento dixital podería ser executado cada mes.

Figura 3.13: Esquema Blumenstock, Cadamuro, e On (2015). datos de chamadas da compañía telefónica foi convertido a unha matriz cunha liña para cada persoa e unha columna para cada recurso (isto é, variable). A continuación, os investigadores construíron un modelo de aprendizaxe supervisada para prever as respostas da investigación da persoa pola matriz recurso. A continuación, o modelo de aprendizaxe supervisada foi utilizado para imputar as respostas da busca para todos. En esencia, os investigadores utilizaron as respostas duns mil persoas para imputar a riqueza de preto dun millón de persoas. Ademais, os investigadores estimaron o lugar aproximado de residencia para os 1,5 millóns de persoas, segundo os lugares das súas chamadas. Cando estas dúas estimacións foron combinados-a riqueza estimada eo lugar estimado de residencia de os resultados foron semellantes estimacións da Enquisa Demográfico e de Saúde, unha investigación tradicional patrón ouro (Figura 3.14).

Figura 3.13: Esquema Blumenstock, Cadamuro, and On (2015) . datos de chamadas da compañía telefónica foi convertido a unha matriz cunha liña para cada persoa e unha columna para cada recurso (ie, variable). A continuación, os investigadores construíron un modelo de aprendizaxe supervisada para prever as respostas da investigación da persoa pola matriz recurso. A continuación, o modelo de aprendizaxe supervisada foi utilizado para imputar as respostas da busca para todos. En esencia, os investigadores utilizaron as respostas duns mil persoas para imputar a riqueza de preto dun millón de persoas. Ademais, os investigadores estimaron o lugar aproximado de residencia para os 1,5 millóns de persoas, segundo os lugares das súas chamadas. Cando estas dúas estimacións foron combinados-a riqueza estimada eo lugar estimado de residencia de os resultados foron semellantes estimacións da Enquisa Demográfico e de Saúde, unha investigación tradicional patrón ouro (Figura 3.14).

Figura 3.14: Resultados de Blumenstock, Cadamuro, e On (2015). Ao nivel individual, os investigadores foron capaces de facer un traballo razoable en predicir a riqueza de alguén dos seus rexistros de chamadas. As estimacións de nivel provincial riqueza que se basearon en estimacións a nivel individual de riqueza e lugar de residencia de os resultados foron semellantes aos resultados da Enquisa Demográfico e de Saúde, unha investigación tradicional patrón ouro.

Figura 3.14: Resultados de Blumenstock, Cadamuro, and On (2015) . Ao nivel individual, os investigadores foron capaces de facer un traballo razoable en predicir a riqueza de alguén dos seus rexistros de chamadas. As estimacións de nivel provincial riqueza que se basearon en estimacións a nivel individual de riqueza e lugar de residencia de os resultados foron semellantes aos resultados da Enquisa Demográfico e de Saúde, unha investigación tradicional patrón ouro.

En conclusión, de Blumenstock amplificado pedindo visión combinada datos da investigación con datos de seguimento dixital para producir estimacións comparables coas estimacións da busca patrón ouro. Este exemplo en particular tamén aclara algúns dos trade-offs entre pedir amplificado e métodos de investigación tradicionais. En primeiro lugar, as estimacións pedindo amplificados foron máis oportuna, substancialmente máis barato, e máis granular. Pero, por outra banda, neste momento, non hai unha forte base teórica para este tipo de pedir amplificado. É dicir, este exemplo non mostra cando vai traballar e cando non vai. Ademais, o enfoque pregunta amplificada non ten boas maneiras para cuantificar a incerteza en torno ás súas estimacións. Con todo, pedindo amplificado ten profundas conexións a tres grandes áreas en en base a estatísticas do modelo de post-estratificación (Little 1993) , de imputación (Rubin 2004) , e de estimación da área pequena (Rao and Molina 2015) -e por iso espero que os avances ser rápido.

Pedindo amplificado segue unha receita básica que pode ser adaptada á súa situación particular. Existen dous ingredientes e dous pasos. Os dous ingredientes son: 1) un conxunto de datos de seguimento dixital que é grande, pero fina (isto é, ten moita xente, pero non a información que precisa sobre cada persoa) e 2) unha investigación que se estreita, pero de espesor (isto é, ten só algunhas persoas, pero ten a información que necesitas sobre eles mesmos). Entón, hai dúas etapas. En primeiro lugar, para a xente en ambas as fontes de datos, construír un modelo de aprendizaxe de máquina que utiliza datos de seguimento dixital para prever respostas da investigación. A continuación, usar este modelo de aprendizaxe de máquina para imputar as respostas da investigación de todos os datos de seguimento dixital. Así, se hai algunha pregunta que quere preguntar a moita xente, ollar os datos de seguimento dixital desas persoas que poden ser usados ​​para prever a súa resposta.

Comparando primeira e segunda tentativa de Blumenstock o problema tamén ilustra unha importante lección sobre a transición da segunda era a enfoques terceira era facer un levantamento de investigación: o inicio non é o final. Isto é, moitas veces, a primeira visión non será o mellor, pero se os investigadores de traballo continuo, as cousas poden mellorar. De xeito máis xeral, ao avaliar novos enfoques para a investigación social na era dixital, é importante facer dúas avaliacións distintas: 1) o quão ben funciona agora e 2) ben pensas que iso pode funcionar no futuro como a paisaxe de datos cambios e como investigadores dedicar máis atención ao problema. Aínda que, os investigadores son adestrados para facer o primeiro tipo de avaliación (o bo é este anaco particular de investigación), a segunda é moitas veces máis importante.