3.6.1 Узмоцнены з просьбай

Гэты пераклад быў створаны з дапамогай кампутара. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.6.1 Узмоцнены з просьбай

Звязаўшы абследаванне для лічбавых слядоў можа быць як пытацца кожнага , вашы пытанні ў любы час.

Прапанаваная ў цэлым ідзе па двух асноўных катэгорыях: выбарачных абследаванняў і перапісаў насельніцтва. Выбарачныя абследавання, дзе Вы можаце атрымаць доступ невялікая колькасць людзей, можа быць гнуткім, своечасовым, і адносна танна. Тым не менш, выбарачных абследаванняў, паколькі яны заснаваныя на выбарцы, часта абмежаваны ў іх вырашэнні; з выбарачнага абследавання, часта бывае цяжка зрабіць ацэнкі аб канкрэтных геаграфічных рэгіёнах або для канкрэтных дэмаграфічных груп. Перапісу, з другога боку, спроба ўзяць інтэрв'ю ў любога ў папуляцыі. Яны маюць вялікае дазвол, але яны , як правіла , дарагія, вузкія ў фокусе (яны ўключаюць у сябе толькі невялікая колькасць пытанняў), а не своечасова (яны адбываюцца па ўсталяваным графіку, напрыклад, кожныя 10 гадоў) (Kish 1979) . Цяпер уявіце сабе, калі б даследчыкі маглі б аб'яднаць у сабе лепшыя характарыстыкі выбарачных абследаванняў і перапісаў; уявіце сабе, калі б даследчыкі маглі задаць усе пытанні ўсім кожны дзень.

Відавочна, што гэта пастаяннае, паўсюднае, заўсёды на абследавання з'яўляецца свайго роду сацыяльнай навукі фантазіі. Але, аказваецца , што мы можам пачаць , каб наблізіць гэта шляхам аб'яднання пытанняў абследавання з невялікага ліку людзей з лічбавымі слядамі ад многіх людзей. Я называю гэты тып камбінацыі ўзмацняецца з просьбай. Калі ўсё зроблена правільна, то гэта можа дапамагчы нам дае ацэнку, якія з'яўляюцца больш лакальнымі (для невялікіх геаграфічных раёнаў), больш крупчастая (для канкрэтных дэмаграфічных груп), а таксама больш своечасова.

Адным з прыкладаў Узмацняецца пытацца прыходзіць ад працы Джошуа Blumenstock, які хацеў, каб сабраць дадзеныя, якія дапамаглі б развіццю кіраўніцтва ў бедных краінах. Больш канкрэтна, Blumenstock хацеў стварыць сістэму для вымярэння багацця і дабрабыту , што ў спалучэнні паўнаты перапісу з гнуткасцю і частатой апытання (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . На самай справе, я ўжо апісаў працу Blumenstock ненадоўга ў главе 1.

Для таго, каб пачаць, Blumenstock партнёрскія адносіны з найбуйнейшым аператарам мабільнай сувязі тэлефона ў Руандзе. Кампанія падала яму анонимизированных запісу транзакцый ад каля 1,5 мільёнаў кліентаў, якія ахопліваюць паводзіны з 2005 і 2009 Журналы ўтрымліваюць інфармацыю аб кожным паведамленні выкліку і тэкст, напрыклад, час пачатку, працягласць і прыблізнае геаграфічнае месцазнаходжанне абанента і прымача. Перад тым, як пачаць казаць аб статыстычных пытанняў, то варта адзначыць, што гэты першы крок можа быць адным з самых цяжкіх. Як апісана ў чале 2, большасць лічбавых дадзеных трасіроўкі недаступная для даследчыкаў. І многія кампаніі апраўдана не вырашаюцца дзяліцца сваімі дадзенымі, паколькі яна з'яўляецца прыватным; што іх кліенты, верагодна, не чакалі, што іх запісы будуць перададзеныя ў масе-з даследнікамі. У гэтым выпадку, даследнікі ўзялі асцярожныя крокі, каб анонимизировать дадзеных і іх праца была пад кантролем трэцяга боку (г.зн. іх IRB). Але, нягледзячы на гэтыя намаганні, гэтыя дадзеныя, верагодна , да гэтага часу ідэнтыфікаваныя і яны , верагодна , утрымліваць сакрэтную інфармацыю (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Я вярнуся да гэтых этычным пытаннем у главе 6.

Нагадаем, што Blumenstock быў зацікаўлены ў вымярэнні багацця і дабрабыту. Але гэтыя рысы не непасрэдна ў запісах выклікаў. Іншымі словамі, гэтыя запісы выклікаў з'яўляюцца няпоўнымі для дадзенага даследавання, агульнай асаблівасцю лічбавых слядоў , якія былі падрабязна абмеркаваны ў чале 2. Але, цалкам верагодна , што запісы выклікаў , верагодна , маюць некаторую інфармацыю аб багацці і дабрабыце. Такім чынам, адзін са спосабаў задаваць пытанне Blumenstock мог бы быць: ці можна прадказаць, як нехта адкажа на абследавання на аснове іх лічбавых дадзеных трасіроўкі? Калі так, то, задаўшы некалькі чалавек, мы можам выказаць здагадку, адказы ўсіх астатніх.

Для ацэнкі гэтага эмпірычнаму, Blumenstock і навуковых супрацоўнікаў з Кігалі інстытут навукі і тэхнікі называецца ўзор каля тысячы кліентаў мабільных тэлефонаў. Даследчыкі патлумачылі мэты праекта ўдзельнікам, прасіў іх згоды звязаць адказаў абследавання для запісаў пра выклікі, а затым задаў ім шэраг пытанняў для ацэнкі іх багацця і дабрабыту, такія, як "ў вас ёсць зрабіць радыё? "і" У вас ёсць ровар? "(гл Малюнак 3.11 для частковага спісу). Усе ўдзельнікі даследавання былі кампенсаваныя ў фінансавым стаўленні.

Затым Blumenstock выкарыстоўвалі працэдуру двухступенчатай агульнага ў навуцы дадзеных: асаблівасць інжынернага наступным падкантрольнага навучання. Ва- першае, у асаблівасць інжынернай стадыі, для ўсіх, хто даваў інтэрв'ю, Blumenstock ператвораныя запісу выклікаў у набор характарыстык аб кожным чалавеку; Навукоўцы дадзеных маглі б назваць гэтыя характарыстыкі "асаблівасці" і сацыёлагі назвалі б іх "зменнымі". Напрыклад, для кожнага чалавека, Blumenstock разлічваецца агульная колькасць дзён з актыўнасцю, колькасць розных людзей, чалавек знаходзіўся ў кантакце з, колькасць грошай, выдаткаваных на эфірны час, і гэтак далей. Крытычна, добрая асаблівасць інжынернага патрабуе веды умоў даследавання. Напрыклад, калі гэта важна адрозніваць ўнутраныя і міжнародныя званкі (мы маглі б чакаць, што людзі, якія называюць на міжнародным узроўні, каб быць багацей), то гэта павінна быць зроблена на асаблівасць інжынернай стадыі. Даследчык з невялікім разуменнем Руанды не можа ўключаць у сябе гэтую функцыю, а затым прагнозны прадукцыйнасць мадэлі будзе пакутаваць.

Далей, у падкантрольнага стадыі вывучэння, Blumenstock пабудавалі статыстычную мадэль для прагназавання адказ на апытанне для кожнага чалавека , у залежнасці ад іх асаблівасцяў. У гэтым выпадку Blumenstock выкарыстоўвалі лагістычную рэгрэсію з 10-кратным крыжаванай праверкі, але ён мог бы выкарыстаць цэлы шэраг іншых падыходаў статыстычных або машыннага навучання.

Так, наколькі добра гэта працавала? Быў Blumenstock ў стане прадказаць адказы на пытанні анкеты, як "У вас ёсць радыё?" І "Ці ёсць у вас ёсць ровар?", Выкарыстоўваючы функцыі, атрыманыя з запісаў пра выклікі? Гатунак. Дакладнасць прадказанняў былі высокія для некаторых прыкмет (мал 3.11). Але, гэта заўсёды важна, каб параўнаць комплексны метад прагназавання супраць просты альтэрнатывы. У гэтым выпадку, просты альтэрнатывай з'яўляецца, каб прадказаць, што кожны дасць найболей агульны адказ. Напрыклад, 97,3% паведамілі, валодаюць радыё, так што калі Blumenstock прадказвалі, што кожны будзе паведамляць аб валоданні радыё ён меў бы дакладнасць 97,3%, што дзіўна падобна на выкананне яго больш складанай працэдуры (дакладнасць 97,6%). Іншымі словамі, усе фантазіі дадзеныя і мадэляванне павысіла дакладнасць прагнозу з 97,3% да 97,6%. Тым не менш, для іншых пытанняў, такіх, як "У вас ёсць ровар?", Прадказанні палепшылася з 54,4% да 67,6%. У больш агульным плане, на малюнку 3.12 паказаны для некаторых прыкмет Blumenstock не палепшыўся далёка за межы проста зрабіць просты базавы прагноз, але і для іншых прыкмет ёсць некаторае паляпшэнне.

Малюнак 3.11: прагнастычныя дакладнасць для статыстычнай мадэлі навучаных з запісамі выклікаў. Вынікі з Табліцы 2 Blumenstock (2014) .

Малюнак 3.12: Параўнанне дакладнасці прагнозу для статыстычнай мадэлі навучаных з запісамі выклікаў да простых базавым прадказанні. Акуляры злёгку jittered, каб пазбегнуць дублявання; см Табліцу 2 Blumenstock (2014) для дакладных значэнняў.

На гэтым этапе вы можаце падумаць , што гэтыя вынікі з'яўляюцца трохі расчароўвае, але толькі адзін год праз, Blumenstock і двое яго калег-Габрыэль Cadamuro і Роберт On-апублікавалі артыкул у часопісе Science з істотна лепшымі вынікамі (Blumenstock, Cadamuro, and On 2015) , Існавалі дзве асноўныя тэхнічныя прычыны для паляпшэння: 1) яны выкарыстоўвалі больш складаныя метады (гэта значыць, новы падыход да асаблівасць тэхнікі і больш складаную мадэль машыннага навучання) і 2), а не спрабаваць вывесці адказы на асобныя пытанні анкеты (напрыклад, "У вас ёсць радыё?"), яны паспрабавалі вывесці індэкс складовага багацця.

Blumenstock і яго калегі прадэманстравалі эфектыўнасць свайго падыходу двума спосабамі. Па-першае, яны выявілі, што для людзей у іх выбарцы, яны маглі б зрабіць вельмі добрую працу прагназавання іх багацця ад запісаў пра выклікі (Малюнак 3.14). Па-другое, і яшчэ больш важна, Blumenstock і яго калегі паказалі, што іх працэдура можа зрабіць ацэнку высокай якасці геаграфічнага размеркавання багацця ў Руандзе. Больш канкрэтна, яны выкарыстоўвалі сваю мадэль машыннага навучання, які праходзіў падрыхтоўку па іх выбарцы з каля 1000 чалавек, каб прадказаць дабрабыт усяго 1,5 мільёна чалавек, у запісах выклікаў. Акрамя таго, з геопространственных дадзеных, ўбудавальных ў дадзеныя апрацоўкі выклікаў (нагадаем, што дадзеныя выкліку ўключае ў сябе размяшчэнне бліжэйшай ячэйкі вежы для кожнага выкліку), даследнікі змаглі ацаніць прыкладнае месца жыхарства кожнага чалавека. Злучаючы гэтыя дзве ацэнкі разам, даследаванне зрабіла ацэнку геаграфічнага размеркавання абаненцкай багацця ў надзвычай тонкай прасторавай дэталізацыі. Напрыклад, яны маглі б ацаніць сярэдняе багацце ў кожнай з 2148 клетак Руанды (найменшая адміністрацыйная адзінка ў краіне). Гэтыя прадказаныя значэння багацця былі настолькі крупчасты іх было цяжка праверыць. Такім чынам, даследчыкі агрэгаваць іх вынікі для атрымання адзнак сярэдняга багацця 30 раёнаў Руанды. Гэтыя ацэнкі раённага ўзроўню былі цесна звязаны з ацэнкамі з залатога стандарту традыцыйнага апытання, руандийская галіне дэмаграфіі і аховы здароўя (Малюнак 3.14). Хоць ацэнкі з гэтых двух крыніц былі падобныя, ацэнкі ад Blumenstock і яго калегі былі прыкладна ў 50 разоў танней і ў 10 разоў хутчэй (калі кошт у вымераныя ў тэрмінах зменных выдаткаў). Такое рэзкае зніжэнне кошту азначае, што замест таго, каб бегчы праз кожныя некалькі гадоў, як гэта стандарт для дэмаграфічных і медыцынскіх абследаванняў-гібрыд невялікага абследавання ў спалучэнні з вялікімі лічбавымі дадзенымі трасіроўкі можа быць запушчаны кожны месяц.

Малюнак 3.13: Схема Blumenstock, Cadamuro і On (2015). Выклік дадзеных з тэлефоннай кампаніі была ператворана ў матрыцу з адным радком для кожнага чалавека і адзін слупок для кожнай функцыі (г.зн. зменнай). Далей даследчыкі пабудавалі мадэль навучання кантраляваную прадказаць адказы на апытанне ад асобы, выкарыстоўваючы функцыю матрыцы. Затым паднаглядных мадэль навучання была выкарыстаная для стаўлення адказаў абследавання для ўсіх. У сутнасці, даследчыкі выкарыстоўвалі адказы каля тысячы людзей прыпісваць багацця каля аднаго мільёна чалавек. Акрамя таго, даследчыкі падлічылі прыкладнае месца пражывання для ўсіх 1,5 мільёна чалавек, грунтуючыся на месцах іх званкоў. Калі гэтыя дзве ацэнкі былі аб'яднаны, паводле ацэнак, багацце і разліковы месца жыхарства-вынікі былі аналагічныя ацэнках ад дэмаграфіі і аховы здароўя, залаты стандарт традыцыйнага апытання (Малюнак 3.14).

Малюнак 3.13: Схема Blumenstock, Cadamuro, and On (2015) . Выклік дадзеных з тэлефоннай кампаніі была ператворана ў матрыцу з адным радком для кожнага чалавека і адзін слупок для кожнай функцыі (г.зн. зменная). Далей даследчыкі пабудавалі мадэль навучання кантраляваную прадказаць адказы на апытанне ад асобы, выкарыстоўваючы функцыю матрыцы. Затым паднаглядных мадэль навучання была выкарыстаная для стаўлення адказаў абследавання для ўсіх. У сутнасці, даследчыкі выкарыстоўвалі адказы каля тысячы людзей прыпісваць багацця каля аднаго мільёна чалавек. Акрамя таго, даследчыкі падлічылі прыкладнае месца пражывання для ўсіх 1,5 мільёна чалавек, грунтуючыся на месцах іх званкоў. Калі гэтыя дзве ацэнкі былі аб'яднаны, паводле ацэнак, багацце і разліковы месца жыхарства-вынікі былі аналагічныя ацэнках ад дэмаграфіі і аховы здароўя, залаты стандарт традыцыйнага апытання (Малюнак 3.14).

Малюнак 3.14: Вынікі Blumenstock, Cadamuro, а на (2015). На індывідуальным узроўні, даследнікі змаглі зрабіць разумную работу пры прадказанні чыё-то багацце ад сваіх запісаў пра выклікі. Ацэнкі раённага ўзроўню багацця, якія былі заснаваныя на ацэнках індывідуальнага ўзроўню дабрабыту і месца жыхарства-вынікі былі падобнымі з вынікамі, атрыманымі ў галіне дэмаграфіі і аховы здароўя, абследавання, залаты стандарт традыцыйнага апытання.

Малюнак 3.14: Вынікі Blumenstock, Cadamuro, and On (2015) . На індывідуальным узроўні, даследнікі змаглі зрабіць разумную работу пры прадказанні чыё-то багацце ад сваіх запісаў пра выклікі. Ацэнкі раённага ўзроўню багацця, якія былі заснаваныя на ацэнках індывідуальнага ўзроўню дабрабыту і месца жыхарства-вынікі былі падобнымі з вынікамі, атрыманымі ў галіне дэмаграфіі і аховы здароўя, абследавання, залаты стандарт традыцыйнага апытання.

У заключэнне Blumenstock-х амплифицировали з просьбай падыход у спалучэнні дадзеных абследавання з лічбавымі дадзенымі трасіроўкі для атрымання адзнак, супастаўных з ацэнкамі абследавання залатым стандартам. Гэты прыватны прыклад таксама тлумачыць некаторыя кампрамісы паміж Узмацняецца задаваць пытанні і традыцыйных метадаў абследавання. Па-першае, амплифицированные з просьбай ацэнкі былі больш своечасова, значна танней, і больш крупчастая. Але, з іншага боку, у гэты час, не існуе моцная тэарэтычная аснова для такога роду ўзмацняліся пытацца. Гэта значыць, гэты прыклад не паказвае, калі ён будзе працаваць і калі ён не будзе. Акрамя таго, узмоцнены запытаная падыход яшчэ не маюць добрыя спосабы колькаснай ацэнкі нявызначанасці вакол сваіх ацэнак. Тым ня менш, узмоцнены запытаная мае глыбокія сувязі ў трох буйных абласцей статыстыкі-мадэль на аснове пост-стратыфікацыі (Little 1993) , стаўлення (Rubin 2004) , а таксама ацэнкі малой плошчы (Rao and Molina 2015) -І таму я чакаю , што прагрэс будзе быць хуткім.

Ўзмоцнены запытаная варта базавы рэцэпт, які можна адаптаваць да вашай канкрэтнай сітуацыі. Ёсць два кампаненты і два крокі. Гэтыя два кампаненты з'яўляюцца: 1) лічбавы след набор дадзеных, які шырокі, але тонкі (гэта значыць, у яго ёсць шмат людзей, але не інфармацыю, што вам трэба пра кожны чалавек) і 2) абследаванне, якое вузкая, але тоўстая (гэта значыць, у яго ёсць ўсяго некалькі чалавек, але ў яго ёсць інфармацыя, што вам трэба пра тых людзей). Затым, існуе два этапы. Па-першае, для людзей у абодвух крыніцах дадзеных, пабудаваць мадэль машыннага навучання, якая выкарыстоўвае лічбавыя дадзеныя трасіроўкі для прагназавання адказаў апытання. Далей выкарыстоўвайце гэтую мадэль машыннага навучання для стаўлення апытання адказы кожнага ў лічбавых дадзеных трасіроўкі. Такім чынам, калі ёсць нейкае пытанне, што вы хочаце, каб папрасіць шмат людзей, шукаць лічбавых дадзеных трасіроўкі ад тых людзей, якія могуць быць выкарыстаны для прагназавання іх адказ.

Параўноўваючы першую і другую спробу Blumenstock па меншай праблеме таксама ілюструе важны ўрок аб пераходзе ад другой эры да трэцяга падыходаў эпохі для абследавання даследаванняў: пачатак не канец. Гэта значыць, у шмат разоў, першы падыход не будзе лепшым, але калі даследчыкі працягваюць працаваць, усё можа стаць лепш. У больш агульным плане, пры ацэнцы новых падыходаў да сацыяльных даследаваннях у эпоху лічбавых тэхналогій, важна, каб зрабіць два розных ацэнак: 1) наколькі добра гэта працуе цяпер, і 2) наколькі добра вы думаеце, што гэта можа працаваць у будучыні ў якасці ландшафту дадзеных змены і як даследчыкі надаюць больш увагі да гэтай праблемы. Хоць даследнікі навучаны, каб зрабіць першы выгляд ацэнкі (наколькі добра гэтая канкрэтная частка даследавання), па-другое, часта больш важна.