3.4.1 Tebygolrwydd samplu: casglu a dadansoddi data data

Gall pwysau ddadwneud ystumiadau a achosir yn fwriadol gan y broses samplu.

Samplau Tebygolrwydd yw'r rhai lle mae pawb yn cael hysbys, di-sero tebygolrwydd o gynhwysiant, ac mae'r dyluniad samplu tebygolrwydd symlaf yn syml samplu ar hap lle mae gan bob person tebygolrwydd gyfartal o gynhwysiad. Pan fydd ymatebwyr yn cael eu dewis drwy samplu ar hap syml gyda gweithredu perffaith (ee, dim camgymeriad sylw ac nid oes diffyg ymateb), yna amcangyfrif yn syml oherwydd bydd-ar y sampl gyfartaledd-fod yn fersiwn bach o'r boblogaeth.

Anaml y samplu ar hap Simple yn cael ei ddefnyddio yn ymarferol, fodd bynnag. Yn hytrach, ymchwilwyr yn fwriadol yn dewis pobl gyda tebygolrwydd anghyfartal o gynhwysiant er mwyn lleihau costau a chynyddu cywirdeb. Pan fydd ymchwilwyr yn fwriadol yn dewis pobl gyda gwahanol tebygolrwydd o gynhwysiant, yna mae angen addasiadau i ddadwneud y afluniadau a achoswyd gan y broses samplu. Mewn geiriau eraill, sut yr ydym yn cyffredinoli o sampl yn dibynnu ar sut y mae'r sampl ei ddewis.

Er enghraifft, mae'r Arolwg Poblogaeth Cyfredol (CPS) yn cael ei ddefnyddio gan y llywodraeth yr Unol Daleithiau i amcangyfrif y gyfradd ddiweithdra. Bob mis tua 100,000 o bobl yn cael eu cyfweld, naill ai wyneb-yn-wyneb neu dros y ffôn, ac mae'r canlyniadau yn cael eu defnyddio i gynhyrchu y gyfradd ddiweithdra a amcangyfrifwyd. Oherwydd bod y llywodraeth yn dymuno i amcangyfrif y gyfradd diweithdra ym mhob cyflwr, ni all wneud sampl ar hap syml o oedolion oherwydd byddai hynny'n cynhyrchu rhy ychydig o ymatebwyr mewn gwladwriaethau sydd â phoblogaethau bach (ee, Rhode Island) ac mae gormod o o wladwriaethau gyda phoblogaethau mawr (ee , California). Yn lle hynny, mae'r samplau CPS bobl mewn gwahanol wladwriaethau ar gyflymder gwahanol, proses a elwir yn samplu haenedig gyda thebygolrwydd anghyfartal o ddethol. Er enghraifft, os bydd y CPS eisiau 2,000 o ymatebwyr fesul wladwriaeth, yna byddai oedolion yn Rhode Island yn cael tua 30 gwaith yn uwch tebygolrwydd o gynhwysiant nag oedolion yng Nghaliffornia (Rhode Island: 2,000 o ymatebwyr fesul 800,000 o oedolion vs California: 2,000 o ymatebwyr fesul 30,000,000 o oedolion). Fel y gwelwn yn nes ymlaen, y math hwn o samplu gyda thebygolrwydd anghyfartal yn digwydd gyda ffynonellau ar-lein o ddata hefyd, ond yn wahanol i'r CPS, y mecanwaith samplu Nid yw fel arfer yn hysbys neu'n cael ei reoli gan yr ymchwilydd.

O ystyried ei ddyluniad samplu, nid yw'r CPS yn uniongyrchol gynrychioliadol o'r Unol Daleithiau; mae'n cynnwys gormod o bobl o Rhode Island a rhy ychydig o California. Felly, byddai'n annoeth i amcangyfrif y gyfradd ddiweithdra yn y wlad gyda'r gyfradd ddiweithdra yn y sampl. Yn lle y cymedr sampl, mae'n well i gymryd cymedr pwysol, lle mae'r pwysau yn cyfrif am y ffaith bod pobl o Rhode Island yn fwy tebygol o gael eu cynnwys na phobl o California. Er enghraifft, byddai pob person o Galiffornia yn upweighted- byddent yn cyfrif mwy yn yr amcangyfrif-ac mae pob person o Rhode Island yn cael ei downweighted-maent yn cyfrif yn llai yn yr amcangyfrif. Yn ei hanfod, yr ydych yn cael mwy o lais i bobl eich bod yn llai tebygol o ddysgu am.

Mae'r enghraifft hon yn dangos tegan pwynt pwysig, ond yn gyffredin gamddeall: Nid oes angen sampl i fod yn fersiwn bach o'r boblogaeth er mwyn cynhyrchu amcangyfrifon da. Os yn gwybod digon am y ffordd y data ei gasglu, yna gall y wybodaeth gael ei defnyddio wrth wneud amcangyfrifon o'r sampl. Mae'r dull Rwyf newydd a ddisgrifir-ac yr wyf yn disgrifio fathemategol yn yr dechnegol atodiad-yn disgyn union o fewn y fframwaith samplu tebygolrwydd clasurol. Yn awr, 'n annhymerus' yn dangos sut y gall yr un syniad yn cael eu cymhwyso i samplau nad ydynt yn tebygolrwydd.