3.4.3 samplau nad ydynt yn tebygolrwydd: paru sampl

Nid yw pob samplau nad ydynt yn tebygolrwydd yr un fath. Gallwn ychwanegu mwy o reolaeth ar y pen blaen.

Mae'r dull Wang a chydweithwyr a ddefnyddiwyd i amcangyfrif y canlyniad yr etholiad arlywyddol 2012 Unol Daleithiau dibynnu'n llwyr ar welliannau mewn dadansoddi data. Hynny yw, maent yn casglu cynifer o ymatebion ag y gallent ac wedyn ceisio ail-bwysau arnynt. Mae strategaeth ategol ar gyfer gweithio gyda samplu di-debygolrwydd yw cael mwy o reolaeth dros y broses o gasglu data.

Yr enghraifft symlaf o broses samplu di-debygolrwydd a reolir yn rhannol yw samplu cwota, techneg sy'n mynd yn ôl i ddyddiau cynnar ymchwil arolwg. Yn samplu cwota, ymchwilwyr rhannu'r boblogaeth yn wahanol grwpiau (ee, dynion ifanc, merched ifanc, ac ati) ac yna gosod cwotâu ar gyfer y nifer o bobl i gael eu dewis ym mhob grŵp. Roedd ymatebwyr yn cael eu dewis mewn ffordd ddi-drefn nes i'r ymchwilydd wedi cyfarfod eu cwota ym mhob grŵp. Oherwydd y cwotâu, roedd y sampl yn deillio yn edrych yn fwy fel y boblogaeth darged nag a fyddai'n wir fel arall, ond oherwydd bod y tebygolrwydd o gynhwysiant yn hysbys llawer o ymchwilwyr yn amheus o samplo cwota. Yn wir, samplu cwota yn achos y "Dewey gorchfygu Truman" gwall yn 1948 polau Unol Daleithiau Arlywyddol. Oherwydd ei fod yn darparu rhywfaint o reolaeth dros y broses samplu, fodd bynnag, gall un weld sut y gallai samplu cwota yn cael rhai manteision dros gasglu data yn gyfan gwbl heb ei reoli.

Symud y tu hwnt samplu cwota, dulliau mwy modern i reoli'r broses samplu di-debygolrwydd yn bosibl yn awr. Gelwir Un dull o'r fath yn cyfateb sampl, ac mae'n cael ei ddefnyddio gan rai darparwyr panel ar-lein masnachol. Yn ei ffurf symlaf, cyfateb sampl yn gofyn am ddwy ffynhonnell data: 1) cofrestr cyflawn o'r boblogaeth a 2) panel mawr o wirfoddolwyr. Mae'n bwysig nad oes angen gwirfoddolwyr i fod yn sampl tebygolrwydd o unrhyw boblogaeth; i bwysleisio nad oes unrhyw ofynion ar gyfer dethol i mewn i'r panel, byddaf yn ei alw yn banel budr. Hefyd, mae'n rhaid i'r gofrestr boblogaeth a'r panel budr yn cynnwys rhywfaint o wybodaeth ategol am bob person, yn yr enghraifft hon, byddaf yn ystyried oedran a rhyw, ond mewn sefyllfaoedd realistig y gallai hyn wybodaeth ategol fod yn llawer mwy manwl. Y gamp paru sampl yw dewis samplau o banel budr mewn ffordd sy'n cynhyrchu samplau sy'n edrych fel samplau tebygolrwydd.

paru Sampl dechrau pan sampl tebygolrwydd efelychu ei gymryd oddi ar y gofrestr boblogaeth; hwn sampl ffug yn dod yn sampl darged. Yna, ar sail y wybodaeth ategol, achosion yn y sampl darged yn cael eu cyfateb i bobl yn y panel budr i ffurfio sampl cyfatebol. Er enghraifft, os oes fenyw 25 mlwydd oed yn y sampl targed, yna mae'r ymchwilydd yn canfod fenyw 25 mlwydd oed gan y panel budr i fod yn y sampl yn cyfateb. Yn olaf, mae aelodau o'r sampl yn cyfateb yn cael eu cyfweld i gynhyrchu'r set derfynol o ymatebwyr.

Hyd yn oed er bod y sampl yn cyfateb yn edrych fel y sampl targed, mae'n bwysig cofio nad oedd y sampl yn cyfateb yn sampl tebygolrwydd. Gall samplau Cyfatebol ond cyd-fynd â'r sampl targed ar y wybodaeth ategol hysbys (ee, oedran a rhyw), ond nid ar nodweddion anfesuredig. Er enghraifft, os yw pobl ar y panel budr yn tueddu i fod yn dlotach-wedi'r cyfan, un rheswm i ymuno â phanel arolwg yw ennill arian-ac yna hyd yn oed os y sampl yn cyfateb yn edrych fel y sampl targed o ran oed a rhyw y bydd yn dal i gael gogwydd tuag at bobl dlawd. Mae hud o samplu tebygolrwydd gwir yw diystyru problemau ar y ddau nodweddion mesur a heb ei fesur (pwynt sy'n gyson â'n trafodaeth ar gyfateb i gasgliadau achosol o astudiaethau arsylwadol ym Mhennod 2).

Yn ymarferol, paru sampl yn dibynnu ar gael banel fawr ac amrywiol yn awyddus i gwblhau arolygon, ac felly mae'n cael ei wneud yn bennaf gan gwmnïau sy'n gallu fforddio i ddatblygu a chynnal panel o'r fath. Hefyd, yn ymarferol, gall fod problemau gyda paru (weithiau yn cyfateb yn dda i rywun yn y sampl targed yn bodoli ar y panel) ac nad ydynt yn ymateb (weithiau pobl yn y sampl yn cyfateb yn gwrthod cymryd rhan yn yr arolwg). Felly, yn ymarferol, ymchwilwyr yn gwneud paru sampl hefyd yn perfformio rhyw fath o addasiad ôl-haeniad i wneud amcangyfrifon.

Mae'n anodd ddarparu gwarantau damcaniaethol ddefnyddiol am paru sampl, ond yn ymarferol gall fod yn perfformio'n dda. Er enghraifft, mae Stephen Ansolabehere a Brian Schaffner (2014) o gymharu tri arolwg cyfochrog o tua 1,000 o bobl a gynhaliwyd yn 2010 gan ddefnyddio tri samplu gwahanol a chyfweld dulliau: post, dros y ffôn, a phanel Rhyngrwyd gan ddefnyddio paru sampl a addasiad ôl-haeniad. Mae'r amcangyfrifon o'r tri dull yn eithaf tebyg i amcangyfrifon o meincnodau ansawdd uchel fel yr Arolwg Cyfredol Poblogaeth (CPS) a'r Arolwg Cyfweliad Iechyd Gwladol (NHIS). Yn fwy penodol, mae'r arolygon Rhyngrwyd a post i ffwrdd ar gyfartaledd o 3 phwynt canran a'r arolwg ffôn i ffwrdd gan 4 pwynt canran. Gwallau hwn fawr tua hyn y byddai rhywun yn ei ddisgwyl o samplau o tua 1,000 o bobl. Er, nid yw'r un o'r moddau hyn cynhyrchu data sylweddol well, yn yr arolwg Rhyngrwyd a ffôn (a gynhaliwyd ddyddiau neu wythnosau) yn sylweddol gyflymach i gae na'r arolwg post (a gymerodd wyth mis), ac mae'r arolwg Rhyngrwyd, oedd yn defnyddio paru sampl, yn rhatach na'r ddau dulliau eraill.

I gloi, mae gwyddonwyr cymdeithasol ac ystadegwyr yn hynod amheus o gasgliadau o'r rhain samplau nad ydynt yn tebygolrwydd, yn rhannol oherwydd eu bod yn gysylltiedig â rhai methiannau embaras o waith ymchwil arolwg o'r fath fel y pôl Llenyddol Digest. Yn rhannol, yr wyf yn cytuno ag amheuaeth hon: samplau nad ydynt yn tebygolrwydd nas addaswyd yn debygol o gynhyrchu amcangyfrifon drwg. Fodd bynnag, os gall ymchwilwyr addasu ar gyfer y tueddiadau yn y broses samplu (ee, ar ôl haeniad) neu reoli'r broses samplu braidd (ee, cyfateb sampl), maent yn gallu cynhyrchu amcangyfrifon gwell, a hyd yn oed amcangyfrifon o ansawdd ddigonol ar gyfer y rhan fwyaf o ddibenion. Wrth gwrs, byddai'n well gwneud samplu tebygolrwydd ddienyddio berffaith, ond nad yw bellach yn ymddangos i fod yn opsiwn realistig.

Mae'r ddau samplau nad ydynt yn debygolrwydd a samplau tebygolrwydd yn amrywio o ran eu hansawdd, ac ar hyn o bryd mae'n debygol yn wir bod y rhan fwyaf amcangyfrifon o samplau tebygolrwydd yn fwy dibynadwy nag amcangyfrifon o samplau nad ydynt yn tebygolrwydd. Ond, hyd yn oed nawr, mae amcangyfrifon o samplau nad ydynt yn debygolrwydd gynnal yn dda-yn ôl pob tebyg yn well na amcangyfrifon o samplau tebygolrwydd wael-gynnal. Bellach, samplau nad ydynt yn tebygolrwydd yn sylweddol rhatach. Felly, mae'n ymddangos bod tebygolrwydd vs samplu di-debygolrwydd yn cynnig o ansawdd cost cyfaddawd (Ffigur 3.6). Gan edrych ymlaen, yr wyf yn disgwyl y bydd yr amcangyfrifon o samplau nad ydynt yn debygolrwydd wneud yn dda-yn dod yn rhatach ac yn well. Ymhellach, oherwydd y chwalfa mewn arolygon ffôn llinell tir a chyfraddau cynyddol o ddiffyg ymateb, yr wyf yn disgwyl y bydd samplau tebygolrwydd dod yn fwy drud ac o ansawdd is. Oherwydd tueddiadau tymor hir hyn, credaf y bydd samplu di-debygolrwydd yn dod yn gynyddol bwysig yn y trydydd cyfnod o ymchwil arolwg.

Ffigur 3.6: Tebygolrwydd samplu o ran arfer a samplu di-debygolrwydd ill dau gategori mawr, heterogenaidd. Yn gyffredinol, mae cost-wall cyfaddawd gyda samplu di-debygolrwydd bod yn gost is ond gwall uwch. Fodd bynnag, gall wneud yn dda-samplu di-debygolrwydd cynhyrchu amcangyfrifon yn well na samplu tebygolrwydd wael-wneud. Yn y dyfodol, yr wyf yn disgwyl y bydd samplu di-debygolrwydd yn gwella ac yn rhatach tra bydd samplu tebygolrwydd yn gwaethygu ac yn fwy costus.

Ffigur 3.6: Tebygolrwydd samplu o ran arfer a samplu di-debygolrwydd ill dau gategori mawr, heterogenaidd. Yn gyffredinol, mae cost-wall cyfaddawd gyda samplu di-debygolrwydd bod yn gost is ond gwall uwch. Fodd bynnag, gall wneud yn dda-samplu di-debygolrwydd cynhyrchu amcangyfrifon yn well na samplu tebygolrwydd wael-wneud. Yn y dyfodol, yr wyf yn disgwyl y bydd samplu di-debygolrwydd yn gwella ac yn rhatach tra bydd samplu tebygolrwydd yn gwaethygu ac yn fwy costus.