3.6.1 stèidh nas daingne a 'faighneachd

'Ceangal agad suirbhidh gu didseatach comharran urrainn e coltach a bhith a' faighneachd na ceistean agad uile duine aig a h-uile turas.

A 'faighneachd san fharsaingeachd a' tighinn ann an dà phrìomh roinnean-seòrsa: suirbhidhean sampaill agus cunntasan. Suirbhidhean sampaill, far a bheil thu cothrom air àireamh bheag de dhaoine, a bhith sùbailte, tràthail, agus an ìre mhath saor. Ach, suirbhidhean sampaill, oir tha iad stèidhichte air sampall, tha iad gu tric air a chuingealachadh ann an rùn; le sgrùdadh sampaill, tha e glè thric cruaidh gus dèanamh tuairmsean mu sònraichte cruinn-eòlach no sgìrean sònraichte airson buidhnean sluaigh. Cunntasan-sluaigh, air an taobh eile, a 'feuchainn ri agallamh a h-uile duine san t-sluagh. Tha iad mòr rùn, ach tha iad san fharsaingeachd daor, cumhang ann fòcas (iad mhàin gabhail a-steach àireamh bheag de cheistean), agus cha tràthail (tachair iad air clàr-ama stèidhichte, mar a h-uile 10 bliadhna) (Kish 1979) . Smaoineachadh a-nis ma-rannsachaidh dh'fhaodadh còmhla as fheàrr feartan suirbhidhean sampaill agus cunntasan-sluaigh; smaoineachadh ma rannsachaidh a dh'fhaodadh iarraidh a h-uile ceist a h-uile duine a h-uile latha.

Gu follaiseach, tha seo leantainneach, uile- làthaireach,-còmhnaidh air suirbhidh tha na sheòrsa de saidheans sòisealta fantasy. Ach, tha e coltach nach urrainn dhuinn tòiseachadh airson a bhith faisg còmhla seo le ceistean suirbhidh bhon àireamh bheag de dhaoine le didseatach fuidheall bho iomadh duine. Their mi ris an t-seòrsa measgachadh stèidh nas daingne ag iarraidh. Ma rinn math, dh'fhaodadh e ar cuideachadh a 'toirt tuairmse gu bheil tuilleadh ionadail (airson nas lugha sgìrean cruinn-eòlasach), barrachd granular (sònraichte airson buidhnean sluaigh), agus nas cudromaich.

Aon eisimpleir de stèidh nas daingne 'faighneachd a' tighinn bhon obair Joshua Blumenstock, a bha ag iarraidh gus dàta a chruinneachadh a bhiodh a 'stiùireadh leasachadh ann an dùthchannan bochda. Tuilleadh sònraichte, Blumenstock ag iarraidh siostam a chruthachadh a thomhas beairteas agus mathas sin còmhla iomlanachd de chunntais leis an t-sùbailteachd agus tricead de suirbhidh (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . Gu dearbh, tha mi air a mhìneachadh mar-thà Blumenstock obair airson ùine ghoirid ann an Caibideil 1.

Airson tòiseachadh, Blumenstock còmhla ri as motha fòn-làimhe solaraiche ann an Rwanda. Tha a 'chompanaidh a thoirt seachad dha anonymized tar clàran bho mu 1.5 millean luchd-ceannach a' còmhdach giùlan bho 2005 agus 2009. Tha logaichean fiosrachadh mu gach gairm agus teachdaireachd teacsa leithid toiseach ùine, fad, agus tuairmseach cruinn-eòlasach location an neach-conaltraidh agus trusaidh. Mus tòisich sinn a 'bruidhinn mu na cùisean staitistigeil, b' fhiach e 'comharrachadh a-mach gur e seo a' chiad cheum dòcha gum bi aon de na bu duilghe. Mar a chaidh a mhìneachadh ann an Caibideil 2, as didseatach sgeul dàta a tha doirbh faighinn thuice do luchd-rannsachaidh. Agus, tha mòran chompanaidhean a tha airidh air hesitant aca a roinneadh dàta oir tha e prìobhaideach; a tha an luchd-ceannach 's dòcha nach robh an dùil gu bheil na clàran aca Thèid co-roinnte-sa mhòr-chuid le-rannsachaidh. Sa chùis seo, tha an luchd-rannsachaidh ghabh cùramach ceumannan gus anonymize an dàta agus an obair aca a chaidh a stiùireadh le treas-phàrtaidh (ie, an IRB). Ach, a dh'aindeoin nan oidhirpean sin, dàta sin a tha 's dòcha fhathast aithneachadh agus tha iad dualtach mothachail fiosrachadh (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Tha mi a 'tilleadh do na beusanta a' cheist ann an Caibideal 6.

A chuimhneachadh gu bheil Blumenstock robh ùidh ann an tomhas beairteas agus mathas. Ach, chan eil sin traits dìreach ann an gairm clàran. Ann am briathran eile, tha na clàran a 'ghairm a tha neo-choileanta airson an rannsachaidh seo, cumanta didseatach comharran a chaidh a dheasbad gu mionaideach ann an Caibideil 2. Ach, tha coltas ann gun ghairm clàran is dòcha beagan fiosrachaidh mu beairteas agus mathas. Mar sin, aon dòigh 'faighneachd Blumenstock na ceist a dh'fhaodadh a bhith: a tha e comasach gu ro-innse ciamar a bhios cuideigin freagairt ri sgrùdadh stèidhichte air an dàta didseatach sgeul? Ma tha, an uair sin le bhith ag iarraidh beagan dhaoine as urrainn dhuinn tomhas de fhreagairtean a h-uile duine eile.

Gus measadh a dhèanamh air seo empirically, Blumenstock agus rannsachadh luchd-cuideachaidh bho Kigali Institiùd Saidheans agus Teicneòlas ris an canar sampall de mu dheidhinn mìle luchd-cleachdaidh fòn-làimhe. Tha luchd-rannsachaidh a mhìneachadh na h-amasan a 'phròiseict gu na com-pàirtichean, a dh'iarr an cead a' ceangal an t-suirbhidh fhreagairtean don ghairm clàran, agus an uair sin chaidh iarraidh orra sreath de cheistean a 'tomhais am beairteas agus mathas, leithid "A bheil thu fhèin a rèidio? "agus" a bheil thu fhèin a 'bhaidhsagal? "(faic Figear 3.11 airson pàirt liosta). A h-uile com-pàirtichean ann an suirbhidh a chaidh airgead-dìolaidh a thaobh ionmhais.

An ath-, Blumenstock chleachdadh dà-cheum modh cumanta ann an dàta saidheans: feart innleadaireachd a leantainn le stiùireadh an ionnsachaidh. An toiseach, ann an feart innleadaireachd cheum, airson a h-uile duine a chaidh agallamh, Blumenstock iompachadh ghairm clàran-steach seata de feartan mu gach neach; dàta luchd-saidheans a dh'fhaodadh gairm na feartan sin "feartan" agus sòisealta luchd-saidheans a chanadh iad "caochladairean." Mar eisimpleir, airson gach neach, Blumenstock obrachadh a-mach an àireamh iomlan de làithean ri gnìomhachd, an àireamh de eadar-dhealaichte daoine neach air a bhith ann an conaltradh le, an t-suim airgead a chosg air airtime, agus mar sin air adhart. Breithneachail, math feart innleadaireachd feum air eòlas air a 'rannsachadh suidheachadh. Mar eisimpleir, ma tha e cudromach dealachadh a dhèanamh eadar dachaigheil agus eadar-nàiseanta gairmean (sinn a shaoileadh daoine a 'gairm eadar-nàiseanta a bhith na bu bheartaiche), an uair sin feumar seo a dhèanamh aig an feart innleadaireachd cheum. Rannsaiche le beagan tuigse air Rwanda dòcha nach eil am feart seo gabhail a-steach, agus an uair sin predictive coileanadh na bidh am modail a 'fulang.

An ath-, ann an stiùireadh ionnsachaidh cheum, Blumenstock thog staitistigeil modail a ràdh le cinnt an t-suirbhidh fhreagairt airson gach neach stèidhichte air feartan aca. Sa chùis seo, Blumenstock chleachdadh regression stiùireadh le 10-fhillte tar-dearbhaidh, ach dh'fhaodadh ea bhith air a chleachdadh an caochladh eile staitistigeil no inneal modhan ionnsachaidh.

Mar sin, dè cho math robh e ag obair? Bha Blumenstock comasach air ro-innse na freagairtean gu ceistean suirbhidh mar "A bheil thu sealbh rèidio?" Agus "A bheil thu fhèin a 'bhaidhsagal?"' Cleachdadh feartan bunaichte às gairm clàran? Seòrsa. Neo-mhearachdachd an ro-innsean bha àrd airson cuid traits (Figear 3.11). Ach, tha e daonnan cudromach gus coimeas a dhèanamh iom-fhillte fàisneachd dòigh an aghaidh sìmplidh eile. Sa chùis seo, sìmplidh eadar-dhealaichte a tha a 'ro-innse gum bi h-uile duine bheir as cumanta a fhreagairt. Mar eisimpleir, 97,3% aithris aig an robh rèidio agus mar sin ma Blumenstock bha h-uile duine an dùil gum biodh aithris rèidio aig an robh e bhiodh neo-mhearachdachd an 97,3%, a tha iongantach coltach ris an coileanadh aige nas iom-fhillte modh-obrach (97.6% mionaideachd). Ann am briathran eile, a h-uile fancy dàta agus modaileadh meudachadh neo-mhearachdachd an fàisneachd bho 97,3% gu 97,6%. Ge-tà, airson ceistean eile, leithid "A bheil thu fhèin a 'bhaidhsagal?", A' leasachadh ro-innsean bho 54.4% gu 67,6%. Tuilleadh fharsaingeachd, Figear 3.12 airson a 'sealltainn cuid de traits Blumenstock cha robh piseach a thoirt air mòran nas fhaide air falbh dìreach a' dèanamh an sìmplidh bun-fàisneachd, ach gun airson eile traits bha cuid leasachaidh.

Figear 3.11: ro neo-mhearachdachd airson staitistigeil modail trèanadh le gairm clàran. Toraidhean bho Clàr 2 de Blumenstock (2014).

Figear 3.11: ro neo-mhearachdachd airson staitistigeil modail trèanadh le gairm clàran. Toraidhean bho Clàr 2 de Blumenstock (2014) .

Figear 3.12: Coimeas eadar predictive airson neo-mhearachdachd staitistigeil modail trèanadh le gairm clàran sìmplidh bun-fàisneachd. Puingean a tha beagan jittered dùblachadh a sheachnadh; faic Clàr 2 de Blumenstock (2014) airson dearbh luachan.

Figear 3.12: Coimeas eadar predictive airson neo-mhearachdachd staitistigeil modail trèanadh le gairm clàran sìmplidh bun-fàisneachd. Puingean a tha beagan jittered dùblachadh a sheachnadh; faic Clàr 2 de Blumenstock (2014) airson dearbh luachan.

Aig an àm seo dh'fhaodadh tu a 'smaoineachadh gu bheil na toraidhean sin tha beagan briseadh-dùil, ach dìreach aon bhliadhna an dèidh sin, Blumenstock agus dithis co-oibrichean-Gabriel Cadamuro agus Raibeart Air fhoillseachadh air pàipear ann an Saidheans le mòr nas fheàrr toraidhean (Blumenstock, Cadamuro, and On 2015) . Bha dà phrìomh adhbharan teicnigeach airson an leasachaidh: 1) iad a chleachdadh nas ionnsaichte dòighean (ie, dòigh-obrach ùr a 'nochdadh innleadaireachd agus nas ionnsaichte inneal modail ionnsachaidh) is 2) seach a bhith a' feuchainn ri infer freagairtean fa leth ceistean suirbhidh (me, "a bheil thu sealbh rèidio?"), tha iad a 'feuchainn ri infer-dhèante beairteas Clàr-ìnnse.

Blumenstock agus co-oibrichean Sheall an coileanadh am modh-obrach ann an dà dhòigh. An toiseach, fhuair iad gun do na daoine ann an sampall, b 'urrainn dhaibh a' dèanamh glè mhath obair fiosachd aca beairteas bho ghairm clàran (Figear 3.14). San dàrna àite, agus a-riamh nas cudromaiche, Blumenstock agus co-obraichean sealltainn gun robh aca modh-obrach a dh'fhaodadh a dhèanamh de dh'àrd-chàileachd tuairmsean de sgaoileadh cruinn-eòlasach de bheairteas ann an Rwanda. Tuilleadh sònraichte, chleachd iad an inneal modail ionnsachaidh, a chaidh an trèanadh aca air sampall de mu 1,000 neach, a 'ro-innse na tha de bheairteas a h-uile 1.5 millean neach ann an gairm clàran. Nas fhaide, le geospatial dàta freumhaichte anns a 'ghairm dàta (a chuimhneachadh gu bheil a' ghairm dàta gabhail a-steach an àite as fhaisge airson gach cealla tùr gairm), an luchd-rannsachaidh b 'urrainn do tuairmse na tuairmseach àite-còmhnaidh gach neach. Sàthadh na tuairmsean dithis còmhla, a 'rannsachadh a dhèanamh tuairmse na cruinn-eòlais a' sgaoileadh beairteas taice aig anabarrach breagha spàsail granularity. Mar eisimpleir, b 'urrainn dhaibh tuairmse na cuibheasachd beairteas anns gach Rwanda an 2148 cheallan (an rianachd an t-aonad as lugha anns an dùthaich). Nam dùil beairteas luachan bha cho granular bha iad doirbh sùil a thoirt air. Mar sin, an luchd-rannsachaidh còmhla toraidhean aca a thoirt gu buil tuairmsean de cuibheasachd beairteas de Rwanda na 30 sgìrean. Nam SGÌRE-ìre tuairmsean a bha gu làidir co-cheangailte ri tuairmsean bho òir coitcheann traidiseanta suirbhidh, a 'Rwandan deamografach agus Sgrùdadh Slàinte (Figear 3.14). Ged a tha tuairmsean bho dhà stòr bha iad coltach, bho na tuairmsean Blumenstock agus co-oibrichean Bha mu 50 tursan nas saoire agus 10 tursan nas luaithe (cosgais ann nuair a thomhas a thaobh chosgaisean caochlaideach). Iongantach seo lùghdachadh ann an cosgaisean a 'ciallachadh gum seach a bhith a' ruith a h-uile dhà no trì bliadhna mar-tha coitcheann airson deamografach agus Slàinte Sgrùdaidhean an-dà-chonnaidh de suirbhidh beag còmhla ri mòr didseatach sgeul dàta a dh'fhaodadh a bhith a 'ruith a h-uile mìos.

Figear 3.13: Schematic de Blumenstock, Cadamuro, agus On (2015). Call dàta bhon chompanaidh fòn Chaidh atharrachadh gu matrix le aon t-sreath airson gach neach agus aon airson gach colbh feart (i.e., caochlaideach). An ath, an luchd-rannsachaidh a thogail a stiùireadh modail ionnsachaidh a ràdh le cinnt an t-suirbhidh freagairtean bho neach le feart matrix. An uair sin, a 'stiùireadh modail ionnsachaidh a chleachdadh gus impute freagairtean an t-suirbhidh airson h-uile duine. Ann an smior, an luchd-rannsachaidh a 'cleachdadh na freagairtean mu mìle daoine a impute na tha de bheairteas mu millean daoine. Cuideachd, tha an luchd-rannsachaidh a 'meas tuairmseach àite-còmhnaidh airson a h-uile 1.5 millean daoine a tha stèidhichte air na h-àiteachan de cheileireadh aca. Nuair a bhiodh na tuairmsean dà bha còmhla-measraichte beairteas agus measraichte àite-còmhnaidh-na toraidhean a bha coltach ri tuairmsean bho deamografach agus Sgrùdadh Slàinte, òir-àbhaisteach traidiseanta suirbhidh (Figear 3.14).

Figear 3.13: Schematic de Blumenstock, Cadamuro, and On (2015) . Call dàta bhon chompanaidh fòn Chaidh atharrachadh gu matrix le aon t-sreath airson gach neach agus aon airson gach colbh feart (ie, caochlaideach). An ath, an luchd-rannsachaidh a thogail a stiùireadh modail ionnsachaidh a ràdh le cinnt an t-suirbhidh freagairtean bho neach le feart matrix. An uair sin, a 'stiùireadh modail ionnsachaidh a chleachdadh gus impute freagairtean an t-suirbhidh airson h-uile duine. Ann an smior, an luchd-rannsachaidh a 'cleachdadh na freagairtean mu mìle daoine a impute na tha de bheairteas mu millean daoine. Cuideachd, tha an luchd-rannsachaidh a 'meas tuairmseach àite-còmhnaidh airson a h-uile 1.5 millean daoine a tha stèidhichte air na h-àiteachan de cheileireadh aca. Nuair a bhiodh na tuairmsean dà bha còmhla-measraichte beairteas agus measraichte àite-còmhnaidh-na toraidhean a bha coltach ri tuairmsean bho deamografach agus Sgrùdadh Slàinte, òir-àbhaisteach traidiseanta suirbhidh (Figear 3.14).

Figear 3.14: Toraidhean bho Blumenstock, Cadamuro, agus On (2015). Aig an neach-ìre, an luchd-rannsachaidh a bha comasach air a dhèanamh reusanta obair aig fiosachd cuideigin beairteas bho aca gairm clàran. Tha tuairmsean SGÌRE-ìre-beairteas a bha stèidhichte air tuairmsean fa leth-ìre de bheairteas agus àite-còmhnaidh-na toraidhean a bha coltach ri toraidhean bho deamografach agus Sgrùdadh Slàinte, òir-àbhaisteach traidiseanta suirbhidh.

Figear 3.14: Toraidhean bho Blumenstock, Cadamuro, and On (2015) . Aig an neach-ìre, an luchd-rannsachaidh a bha comasach air a dhèanamh reusanta obair aig fiosachd cuideigin beairteas bho aca gairm clàran. Tha tuairmsean SGÌRE-ìre-beairteas a bha stèidhichte air tuairmsean fa leth-ìre de bheairteas agus àite-còmhnaidh-na toraidhean a bha coltach ri toraidhean bho deamografach agus Sgrùdadh Slàinte, òir-àbhaisteach traidiseanta suirbhidh.

Ann an co-dhùnadh, Blumenstock na stèidh nas daingne ag iarraidh modh-obrach còmhla ri dàta suirbhidh didseatach sgeul dàta a chur ri chèile tuairmsean an coimeas ris an òr-àbhaisteach suirbhidh tuairmsean. Tha seo gu sònraichte cuideachd mar eisimpleir a 'soilleireachadh cuid de na cur-às-mhalairt eadar stèidh nas daingne faighneachd traidiseanta agus modhan sgrùdaidh. A 'chiad, an stèidh nas daingne a' faighneachd tuairmsean bha nas cudromaich, gu mòr nas saoire, agus nas granular. Ach, air an làimh eile, aig an àm seo, chan eil làidir teòiridheach bhun-stèidh airson an seòrsa seo de stèidh nas daingne faighneachd. 'Se sin, seo aon eisimpleir chan eil a' nochdadh nuair a thèid obair agus uair nach. A bharrachd, tha stèidh nas daingne iarraidh dòigh-obrach nach eil fhathast math ri dòighean tomhais mì-chinnt timcheall air a tuairmsean. Ge-tà, tha stèidh nas daingne faighneachd domhainn ceanglaichean ri trì raointean mòra ann an staitistig-modail-dreuchd stèidhichte-stratification (Little 1993) , cur às leth (Rubin 2004) , agus beag-mheas sgìre (Rao and Molina 2015) Rìoghachd mar sin tha mi an dùil gun tig adhartas a bhith luath.

Stèidh nas daingne faighneachd a leanas bunaiteach reasabaidh a dh'fhaodas a bhith air a thàillearachd gus suidheachadh sònraichte agad. Tha dà bhanachdaich agus dà cheum. Tha dà bhanachdaich tha 1) digiteach sgeul sean a tha farsaing ach tana (is e sin, tha mòran dhaoine, ach chan eil am fiosrachadh a tha a dhìth oirbh mu gach neach) agus 2) suirbhidh a tha caol ach tiugh (is e sin, tha ach beagan dhaoine, ach tha am fiosrachadh a dh'fheumas tu mu na daoine sin). An uair sin, tha dà cheum. A 'chiad, airson na daoine anns an dà tobraichean dàta, a thogail inneal modail ionnsachaidh a chleachdas didseatach sgeul dàta obrachadh a-mach freagairtean suirbhidh. An ath, 'cleachdadh a' mhodail ionnsachaidh gu inneal impute freagairtean an t-suirbhidh na h-uile duine ann an digiteach sgeul dàta. Mar sin, ma tha cuid ceist a tha thu ag iarraidh iarraidh mòran dhaoine, a 'coimhead airson didseatach sgeul dàta bho na daoine a dh'fhaodadh a bhith air a chleachdadh airson ro-innse an fhreagairt aca.

Blumenstock 'dèanamh coimeas eadar a' chiad agus an dàrna oidhirp air an trioblaid cuideachd a 'sealltainn an leasan cudromach mun a' ghluasad bhon dara linn gus an treas linn modhan airson sgrùdadh a rannsachadh: an toiseach nach eil an deireadh. 'Se sin, iomadh uair, a' chiad dòigh-obrach nach bi a 'as fheàrr, ach ma rannsachaidh leantainneach obrach, rudan gheibh nas fheàrr. Tuilleadh San fharsaingeachd, nuair measadh air modhan ùra airson rannsachadh sòisealta anns an àm dhidseatach, tha e cudromach a dhèanamh dà-dhealaichte measaidhean: 1) dè cho math 'dèanamh an obair seo a-nis agus 2) cho math' sa shaoileas sibh a dh'fhaodadh seo a bhith ag obair san àm ri teachd mar an dàta tìre atharrachaidhean, agus mar rannsachaidh cosgadh barrachd aire air an duilgheadas. Ged a tha luchd-rannsachaidh a thrèanadh a dhèanamh a 'chiad seòrsa de mheasadh (dè cho math' S e seo gu h-àraid pìos rannsachaidh), an dàrna S tric nas cudromaiche.