3.4.1 waarskynlikheidsteekproefneming: versameling en data data-analise

Gewigte kan ondergang doelbewus veroorsaak deur die monsterneming proses ongedaan te maak.

Waarskynlikheid monsters is dié waar alle mense het 'n bekende, nie-nul waarskynlikheid van insluiting, en die eenvoudigste waarskynlikheidsteekproefneming ontwerp is eenvoudige ewekansige steekproefneming waar elke persoon het gelyke kans insluiting. Wanneer die respondente is gekies deur middel van eenvoudige ewekansige steekproefneming met 'n volkome uitvoering (bv, geen dekking fout en geen nie-reaksie), dan skatting is eenvoudig omdat die monster sal op 'n miniatuur weergawe van die bevolking gemiddelde-wees.

Eenvoudige ewekansige steekproefneming is selde in die praktyk gebruik, egter. Inteendeel, navorsers mense met ongelyke waarskynlikhede van insluiting kies doelbewus om koste te verminder en die verhoging van akkuraatheid. Wanneer navorsers doelbewus mense met verskillende waarskynlikhede van insluiting kies, dan aanpassings wat nodig is om die ondergang wat veroorsaak word deur die monsterneming proses ongedaan te maak. Met ander woorde, hoe ons veralgemeen van 'n monster hang af van hoe die monster is gekies.

Byvoorbeeld, is die huidige bevolking Survey (CPS) wat gebruik word deur die Amerikaanse regering om die werkloosheidskoers te skat. Elke maand ongeveer 100,000 mense ondervra, óf van aangesig tot aangesig of oor die telefoon, en die resultate word gebruik om die geskatte werkloosheidsyfer produseer. Omdat die regering wil die werkloosheidsyfer in elke staat skat, kan dit 'n eenvoudige ewekansige steekproef van volwassenes nie doen nie, omdat dit te min respondente sou oplewer in lande met klein bevolkings (bv, Rhode Island) en te veel van lande met groot bevolkings (bv , Kalifornië). In plaas daarvan, die CPS monsters mense in verskillende lande teen verskillende tempo's, 'n proses genaamd gestratifiseerde steekproefneming met ongelyke waarskynlikheid van seleksie. Byvoorbeeld, as die CPS wou 2000 respondente per staat, dan volwassenes in Rhode Island sal ongeveer 30 keer hoër waarskynlikheid van insluiting as volwassenes in Kalifornië het (Rhode Island: 2000 respondente per 800,000 volwassenes vs Kalifornië: 2000 respondente per 30.000.000 volwassenes). Soos ons later sal sien, hierdie soort van steekproefneming met ongelyke waarskynlikheid gebeur met aanlyn bronne van data ook, maar in teenstelling met die CPS, is die monsters meganisme gewoonlik nie bekend of beheer word deur die navorser.

Gegewe sy steekproefontwerp, die CPS is nie direk verteenwoordiger van die VSA; Dit sluit ook baie mense van Rhode Island en te min van Kalifornië. Daarom sou dit onwys wees om die werkloosheidsyfer in die land te skat met die werkloosheidsyfer in die monster. In plaas van die steekproefgemiddelde, is dit beter om 'n geweegde gemiddelde, waar die gewigte rekening vir die feit dat mense uit Rhode Island was meer geneig om ingesluit te word as mense van Kalifornië neem. Byvoorbeeld, sou elke persoon van Kalifornië wees upweighted- hulle meer in die beraming-en elke persoon uit Rhode Island sal tel downweighted-hulle sou minder in die skatting tel. In wese is, kry jy meer stem om mense wat jy is minder geneig om te leer oor.

Dit speelgoed voorbeeld illustreer 'n belangrike maar algemeen misverstaan ​​punt: 'n monster het nie nodig om 'n miniatuur weergawe van die bevolking wees om goeie beramings te produseer. As genoeg bekend is oor hoe die data ingesamel is, dan is hierdie inligting kan gebruik word wanneer die maak van skattings van die monster. Die benadering wat ek net beskryf-en dat ek wiskundig beskryf in die tegniese bylae-val vierkantig binne die klassieke waarskynlikheidsteekproefneming raamwerk. Nou, ek sal wys hoe daardie selfde idee kan toegepas word op nie-waarskynlikheid monsters.