3.6.1 amplified ag iarraidh

Is féidir le Nascadh do shuirbhé a rianta digiteach a bheith cosúil le iarraidh ar gach duine do chuid ceisteanna i gcónaí.

Ag cur ceiste thagann go ginearálta i dhá phríomhchatagóir: shamplashuirbhéanna agus de dhaonáirimh. Is féidir le suirbhéanna samplacha, áit a bhfuil tú rochtain a fháil ar líon beag daoine, a bheith solúbtha, tráthúil, agus réasúnta saor. Mar sin féin, suirbhéanna samplacha, toisc go bhfuil siad bunaithe ar shampla, teoranta go minic i n-réitigh; le suirbhé samplach, tá sé deacair go minic a meastacháin a dhéanamh faoi réigiúin gheografacha shonracha nó do ghrúpaí déimeagrafacha ar leith. Áirimh, ar an taobh eile, iarracht gach duine a chur faoi agallamh sa daonra. Tá siad rún go hiontach, ach tá siad costasach go ginearálta, caol i bhfócas (áirítear iontu ach líon beag ceisteanna), agus ní tráthúil (a tharlaíonn siad ar sceideal seasta, ar nós gach 10 mbliana) (Kish 1979) . Anois a shamhlú má d'fhéadfadh taighdeoirí le chéile na saintréithe is fearr de shamplashuirbhéanna agus de dhaonáirimh; shamhlú má d'fhéadfadh taighdeoirí iarr ar gach ceist do gach duine gach lá.

Ar ndóigh,, uileláithreach, i gcónaí ar shuirbhé is leanúnach a chineál an Fantasy eolaíochta sóisialta. Ach, is cosúil gur féidir linn tús le comhfhogasú seo a chur le chéile ceisteanna suirbhé ó líon beag daoine a bhfuil rianta digiteach ó go leor daoine. Glaoim gcineál seo meascán amplified ag iarraidh. Má dhéanamh go maith, d'fhéadfadh sé cabhrú fáil dúinn meastachán atá níos áitiúla (do limistéir geografacha lú), gráinneach níos (do ghrúpaí déimeagrafacha ar leith), agus níos tráthúla.

Tagann Sampla amháin de iarraidh amplified ó obair Joshua Blumenstock, a bhí ag iarraidh sonraí a bheadh ​​ina chabhair d'fhorbairt treoir i dtíortha bochta a bhailiú. Go sonrach, theastaigh Blumenstock chun córas saibhreas agus folláine a chéile ar iomláine an daonáirimh leis an tsolúbthacht agus minicíocht suirbhé a thomhas (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . Go deimhin, tá mé cur síos cheana féin ag obair Blumenstock ar feadh tamaill i gCaibidil 1.

Chun tús a chur, i gcomhpháirtíocht Blumenstock leis an soláthraí fón póca is mó i Ruanda. An chuideachta ar fáil dó taifid idirbheart anonymized ó thart ar 1.5 milliún custaiméir ag clúdach iompar ó 2005 agus 2009. faisnéis faoi gach teachtaireacht glao agus téacs Na logs cosúil leis an t-am tús, ré, agus suíomh geografach thart ar an té atá ag glaoch agus glacadóir. Sula dtosaíonn muid ag caint faoi na saincheisteanna staidrimh, is fiú a lua go bhféadfadh an chéad chéim seo a bheith ar cheann de na is deacra. Mar a chuirtear síos i gCaibidil 2, is mó sonraí rian digiteach inaccessible do thaighdeoirí. Agus, go leor cuideachtaí go dlisteanach hesitant chun a gcuid sonraí toisc go bhfuil sé príobháideach; go bhfuil a gcuid custaiméirí is dócha nach raibh súil leis go mbeidh a gcuid taifead a roinnt-mórchóir-le taighdeoirí. Sa chás seo, ghlac na taighdeoirí céimeanna cúramach a anonymize na sonraí agus rinne maoirseacht ar a gcuid oibre ag tríú páirtí (ie, a IRB). Ach, in ainneoin na n-iarrachtaí, tá na sonraí dócha go fóill inaitheanta agus tá siad dócha faisnéis íogair (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Beidh mé ar ais chuig na gceist eiticiúil i gCaibidil 6.

Chun cuimhne go raibh suim acu i saibhreas agus folláine a thomhas Blumenstock. Ach, nach bhfuil na tréithe go díreach sna taifid glaoch. I bhfocail eile, tá na taifid glaoch neamhiomlán don taighde, gné choitianta de rianta digiteach pléadh go mion i gCaibidil 2. Ach, is cosúil go bhfuil na taifid glaoch dócha roinnt eolais faoi saibhreas agus dea-bhail. Mar sin, bealach amháin a iarraidh fhéadfadh cheist Blumenstock bheith: is féidir a thuar conas a rachaidh duine freagra a thabhairt ar suirbhé bunaithe ar a shonraí rian digiteach? Más amhlaidh, ansin trí iarraidh ar roinnt daoine is féidir linn a buille faoi thuairim na freagraí ar gach duine eile.

Chun seo a mheas empirically, ar a dtugtar Blumenstock agus taighde cúntóirí ó Kigali Institiúid Eolaíochta agus Teicneolaíochta sampla de thart ar míle custaiméir fón póca. Na taighdeoirí Mhínigh spriocanna an tionscadail leis na rannpháirtithe, iarradh a thoiliú le freagraí an tsuirbhé a nascadh leis na taifid glaoch, agus ansin d'iarr orthu sraith ceisteanna chun a saibhreas agus dea-bhail a thomhas, mar shampla "An bhfuil tú féin a raidió? "agus" An bhfuil tú féin rothar? "(féach Figiúr 3.11 le haghaidh liosta páirteach). Rinneadh chúiteamh na rannpháirtithe uile sa suirbhé ó thaobh airgeadais.

Next, a úsáidtear Blumenstock nós imeachta dhá chéim choitianta san eolaíocht sonraí: innealtóireacht gné dhiaidh fhoghlaim faoi mhaoirseacht. Gcéad dul síos, sa chéim gné innealtóireachta, do gach duine a cuireadh agallamh go, thiontú Blumenstock na taifid glaoch i sraith de saintréithe faoi gach duine; D'fhéadfadh eolaithe sonraí glaoch ar na tréithe "gnéithe" agus go mbeadh eolaithe sóisialta glaoch orthu "athróga." Mar shampla, i gcás gach duine, Blumenstock ríomh líon iomlán na laethanta leis an ngníomhaíocht, ar líon na ndaoine ar leith go raibh duine i dteagmháil leis, an méid airgid a chaitear ar am craolta, agus mar sin de. Go criticiúil, éilíonn dea-innealtóireacht gné eolas ar an leagan taighde. Mar shampla, má tá sé tábhachtach idirdhealú a dhéanamh idir glaonna intíre agus idirnáisiúnta (d'fhéadfadh muid ag súil le daoine a ghlaoch idirnáisiúnta a bheith níos saibhre), ansin ní mór a dhéanamh ar an chéad chéim gné innealtóireachta. Ní fhéadfadh taighdeoir le tuiscint beag Ruanda san áireamh an ghné seo, agus ansin beidh an fheidhmíocht thuarthach na samhla ag fulaingt.

Next, sa chéim foghlama faoi mhaoirseacht, a tógadh Blumenstock múnla staidrimh a thuar an freagra suirbhé do gach duine atá bunaithe ar a ngnéithe. Sa chás seo, a úsáidtear Blumenstock aischéimnithí logistic le 10-huaire tras-bhailíochtaithe, ach d'fhéadfadh sé a bheith in úsáid ar éagsúlacht de chur chuige foghlama staidrimh nó eile meaisín.

Mar sin, cé chomh maith raibh sé ag obair? Bhí Blumenstock ann freagraí a thuar chun ceisteanna ar nós suirbhé "An bhfuil tú féin raidió?" Agus "An bhfuil tú féin ar rothar?" Baint úsáide as gnéithe a dhíorthaítear ó thaifid glaoch? Sórtáil de. Ba iad na cruinneas na tuar ard do roinnt tréithe (Figiúr 3.11). Ach, tá sé tábhachtach i gcónaí a chur i gcomparáid le modh thuar casta i rogha simplí. Sa chás seo, tá rogha eile simplí a thuar go mbeidh gach duine a thabhairt ar an freagra is coitianta. Mar shampla, thuairiscigh 97.3% ina húinéir ar raidió mar sin dá mbeadh tuartha Blumenstock go mbeadh gach duine a thuairisciú ina húinéir ar raidió bheadh ​​aige beachtas 97.3%, atá ionadh cosúil leis an fheidhmíocht a chuid nós imeachta níos casta (97.6% cruinneas). I bhfocail eile, na sonraí mhaisiúil agus samhaltú mhéadaigh cruinneas an prediction ó 97.3% go dtí 97.6%. Mar sin féin, maidir le ceisteanna eile, mar shampla "An bhfuil tú féin rothar?", Feabhas ar an tuar ó 54.4% go dtí 67.6%. Níos ginearálta, seónna Fíor 3.12 do roinnt tréithe Blumenstock raibh feabhas i bhfad níos faide ná díreach a dhéanamh ar an tuar bonnlíne simplí, ach gur le haghaidh tréithe eile go raibh feabhas áirithe.

Fíor 3.11: cruinneas Thuarthach haghaidh múnla staitistiúil oilte le taifid glaoch. Torthaí ó Thábla 2 d'Blumenstock (2014).

Fíor 3.11: cruinneas Thuarthach haghaidh múnla staitistiúil oilte le taifid glaoch. Torthaí ó Thábla 2 d' Blumenstock (2014) .

Figiúr 3.12: Comparáid cruinnis thuarthach le haghaidh múnla staitistiúil oilte le taifid glaoch chun prediction bonnlíne simplí. Pointí a jittered beagán forluí a sheachaint; féach Tábla 2 de Blumenstock (2014) do na luachanna cruinn.

Figiúr 3.12: Comparáid cruinnis thuarthach le haghaidh múnla staitistiúil oilte le taifid glaoch chun prediction bonnlíne simplí. Pointí a jittered beagán forluí a sheachaint; féach Tábla 2 de Blumenstock (2014) do na luachanna cruinn.

Ag an bpointe seo d'fhéadfá a bheith ag smaoineamh go bhfuil na torthaí le beagán díomá, ach aon bhliain amháin ina dhiaidh sin, Blumenstock agus dhá chomhghleacaithe-Gabriel Cadamuro agus Robert Ar-fhoilsigh an páipéar san Eolaíocht le torthaí i bhfad níos fearr (Blumenstock, Cadamuro, and On 2015) . Bhí dhá phríomh chúiseanna teicniúla chun feabhas: 1) a úsáidtear iad modhanna níos sofaisticiúla (ie, cur chuige nua innealtóireachta agus múnla foghlama meaisín níos sofaisticiúla chun gné) agus 2) in ionad ag iarraidh freagraí ar cheisteanna suirbhé aonair tátal a bhaint astu (eg, "An bhfuil tú féin raidió?"), iarracht siad chun tátal a bhaint astu ar innéacs saibhreas ilchodach.

Blumenstock agus comhghleacaithe léirigh bhfeidhmiú a gcuid chuige ar dhá bhealach. Gcéad dul síos, fuair siad go bhfuil do na daoine ina sampla, d'fhéadfadh siad a dhéanamh post maith go leor tuar n-saibhreas ó thaifid glaonna (Figiúr 3.14). Dara, agus a bhí riamh níos tábhachtaí fós, léirigh Blumenstock agus comhghleacaithe go bhféadfadh a n-nós imeachta meastacháin ar ardchaighdeán ar an dáileadh geografach an rachmais i Ruanda. Go sonrach, bhain siad úsáid as a n-eiseamláir foghlama meaisín, bhí oiliúint a ar a sampla de thart ar 1,000 duine, a thuar an saibhreas na 1.5 milliún duine sna taifid glaoch. Thairis sin, leis na sonraí geospásúla leabaithe sna sonraí glaonna (thabhairt chun cuimhne go n-áirítear na sonraí glaoch an suíomh an túir cille is gaire do gach glao), bhí na taighdeoirí in ann meastachán a dhéanamh ar áit thart chónaithe gach duine. Ag cur an dá meastacháin chéile, chuir an taighde meastachán ar dháileadh geografach an rachmais suibscríobhaí ag gráinneacht spásúil an-bhreá. Mar shampla, d'fhéadfadh na páistí a mheas an saibhreas an meán i ngach ceann de Ruanda 2148 cealla (an t-aonad is lú riaracháin sa tír). Bhí na luachanna saibhreas tuartha chomh granular bhí siad deacair a sheiceáil. Mar sin, comhiomlánú na taighdeoirí a gcuid torthaí meastacháin de mheán saibhreas Ruanda 30 ceantair tháirgeadh. Bhí na meastacháin dúiche-leibhéal a bhaineann go láidir leis na meastacháin ó shuirbhé óir caighdeánach traidisiúnta, an Déimeagrafacha agus Sláinte Suirbhé Ruanda (Figiúr 3.14). Cé go raibh na meastacháin ó na dhá fhoinse den chineál céanna, bhí na meastacháin ó Blumenstock agus comhghleacaithe thart ar 50 uair níos saoire agus 10 uair níos tapa (nuair costas in thomhas i dtéarmaí costais athraitheacha). Ciallaíonn sé seo laghdú suntasach ar chostas seachas a bheith ar siúl gach cúpla bliain-is caighdeánach do Déimeagrafacha agus Sláinte Suirbhéanna-an fhéadfadh hibrideach de suirbhé beag in éineacht le sonraí rian mór digiteacha a chur ar siúl gach mí.

Fíor 3.13: Scéimreach na Blumenstock, Cadamuro, agus ar (2015). Athraíodh sonraí Call ón gcuideachta gutháin chuig maitrís le chéile amháin do gach duine agus colún amháin le haghaidh gach gné (.i, athróg). Next, a tógadh na taighdeoirí samhail foghlama faoi mhaoirseacht a thuar na freagraí suirbhé ón duine maitrís gné. Ansin, baineadh úsáid as an tsamhail foghlama faoi mhaoirseacht a impute na freagraí suirbhé do gach duine. Go bunúsach, a úsáidtear na taighdeoirí na freagraí de thart ar míle duine a impute an saibhreas de thart ar aon mhilliún duine. Ina theannta sin, mheas na taighdeoirí an áit thart chónaithe do chách 1.5 milliún duine atá bunaithe ar an suíomh na n-glaonna. Nuair a bhí le chéile-an dá meastacháin a bhí saibhreas measta agus an áit a mheastar chónaithe-na torthaí den chineál céanna meastacháin ón Déimeagrafacha agus Suirbhé Sláinte, suirbhé traidisiúnta ór-chaighdeánach (Figiúr 3.14).

Fíor 3.13: Scéimreach na Blumenstock, Cadamuro, and On (2015) . Athraíodh sonraí Call ón gcuideachta gutháin chuig maitrís le chéile amháin do gach duine agus colún amháin le haghaidh gach gné (ie, athróg). Next, a tógadh na taighdeoirí samhail foghlama faoi mhaoirseacht a thuar na freagraí suirbhé ón duine maitrís gné. Ansin, baineadh úsáid as an tsamhail foghlama faoi mhaoirseacht a impute na freagraí suirbhé do gach duine. Go bunúsach, a úsáidtear na taighdeoirí na freagraí de thart ar míle duine a impute an saibhreas de thart ar aon mhilliún duine. Ina theannta sin, mheas na taighdeoirí an áit thart chónaithe do chách 1.5 milliún duine atá bunaithe ar an suíomh na n-glaonna. Nuair a bhí le chéile-an dá meastacháin a bhí saibhreas measta agus an áit a mheastar chónaithe-na torthaí den chineál céanna meastacháin ón Déimeagrafacha agus Suirbhé Sláinte, suirbhé traidisiúnta ór-chaighdeánach (Figiúr 3.14).

Fíor 3.14: Torthaí ó Blumenstock, Cadamuro, agus ar (2015). Ag an duine aonair-leibhéal, bhí na taighdeoirí in ann a dhéanamh i gcomhair poist réasúnta ag tuar saibhreas duine óna taifid glaoch. Ba iad na meastacháin ar dúiche-leibhéal rachmais-a bhí bunaithe ar mheastacháin aonair-leibhéal rachmais agus áit chónaithe-torthaí cosúil leis na torthaí ó Shuirbhé Déimeagrafacha agus Sláinte, suirbhé traidisiúnta ór-chaighdeán.

Fíor 3.14: Torthaí ó Blumenstock, Cadamuro, and On (2015) . Ag an duine aonair-leibhéal, bhí na taighdeoirí in ann a dhéanamh i gcomhair poist réasúnta ag tuar saibhreas duine óna taifid glaoch. Ba iad na meastacháin ar dúiche-leibhéal rachmais-a bhí bunaithe ar mheastacháin aonair-leibhéal rachmais agus áit chónaithe-torthaí cosúil leis na torthaí ó Shuirbhé Déimeagrafacha agus Sláinte, suirbhé traidisiúnta ór-chaighdeán.

Mar fhocal scoir, amplified Blumenstock s ag iarraidh sonraí suirbhé chuige comhcheangailte le sonraí rian digiteach meastacháin inchomparáide le meastacháin suirbhé ór-chaighdeán a tháirgeadh. Soiléiríonn an sampla ar leith freisin ar roinnt de na comhbhabhtálacha idir iarraidh amplified agus modhanna suirbhéireachta traidisiúnta. Gcéad dul síos, bhí na meastacháin ag iarraidh ar amplified níos tráthúla, go substaintiúil níos saoire, agus níos mó gráinneach. Ach, ar an láimh eile, ag an am seo, nach bhfuil bunús láidir teoiriciúil don chineál seo iarraidh amplified. Is é sin, ní dhéanann an sampla amháin a thaispeáint nuair a bheidh sé ag obair agus nuair ní bheidh sé. Thairis sin, nach bhfuil cur chuige iarraidh amplified fós bealaí maith neamhchinnteacht timpeall a meastacháin a chainníochtú. Mar sin féin, tá iarraidh amplified naisc domhain le trí réimsí móra i staitisticí-samhail-bhunaithe iar-srathú (Little 1993) ,-leith (Rubin 2004) , agus meastachán limistéir bhig (Rao and Molina 2015) -agus mar sin mé ag súil go mbeidh dul chun cinn bheith tapa.

leanas iarraidh amplified chos bunúsach is féidir a chur in oiriúint do do staid ar leith. Tá dhá comhábhair agus dhá chéim. Is iad an dá comhábhair 1) rian tacar sonraí digiteach atá leathan ach tanaí (is é sin, tá sé go leor daoine ach nach bhfuil an t-eolas gur gá duit faoi gach duine) agus 2) suirbhé atá caol, ach tiubh (is é sin, tá sé ach cúpla duine, ach tá sé an t-eolas gur gá duit faoi na daoine). Ansin, tá dhá chéim. Gcéad dul síos, do na daoine i bhfoinsí araon sonraí, a thógáil múnla foghlama meaisín go n-úsáideann sonraí rian digiteach a freagraí suirbhé thuar. Next, a úsáid go samhail foghlama meaisín a impute an suirbhé gach duine sna sonraí rian digiteach. Dá bhrí sin, má tá roinnt cheist gur mhaith leat a iarraidh go leor de na daoine, breathnú ar shonraí rian digiteach ó na daoine a d'fhéadfaí a úsáid chun a bhfreagra a thuar.

Comparáid a dhéanamh chéad agus an dara iarracht Blumenstock ag an bhfadhb sin chomh maith ceacht tábhachtach mar gheall ar an t-aistriú ón dara ré cur chuige tríú ré taighde chun suirbhé: nach bhfuil an tús an deireadh. Is é sin, a mhéad uair, an chéad chur chuige ní bheidh an chuid is fearr, ach má taighdeoirí leanúnacha ag obair, is féidir rudaí a fháil níos fearr. Níos ginearálta, agus meastóireacht á déanamh chuige nua maidir le taighde sóisialta san aois dhigiteach, tá sé tábhachtach a dhéanamh ar dhá meastóireachtaí ar leith: 1) cé chomh maith a oibríonn seo anois agus 2) cé chomh maith is a cheapann tú a d'fhéadfadh sé seo ag obair sa todhchaí mar an tírdhreach sonraí athruithe agus mar thaighdeoirí chaitheamh ar aird níos mó ar an bhfadhb. Cé go bhfuil, taighdeoirí oilte iad a dhéanamh ar an chéad chineál measúnaithe (cé chomh maith is an píosa ar leith taighde), is é an dara go minic níos tábhachtaí.