3.4.1 Aussiichten probéieren: Daten Kollektioun an analyteschen

Gewiichter kënnt vun der spezielle Prozess distortions duerzou ëmmer net réckgängeg.

Wahrscheinlechkeet Echantillon sinn déi wou all Leit hunn e bekannt, Net-Null Wahrscheinlechkeet Inclusioun, an einfach Probabilitéit probéieren Design ass einfach zoufälleg probéieren wou all Persoun selwecht Wahrscheinlechkeet Inclusioun huet. Wann den Interviewten via einfach zoufälleg probéieren mat perfekt Ausféierung ausgewielt ginn (zB, keng Deckung Fehler an keen Net-Äntwert), dann ass Estimatioun einfach well d'Prouf wäerten-iwwert Mini Versioun vun der Bevëlkerung Duerchschnëtt-ginn.

Einfach zoufälleg probéieren ass seelen zu Praxis benotzt Ee. Éischter, wielt Fuerscher duerzou Leit mat ongläich Wahrscheinlechkeeten vun Inclusioun fir Käschten ze reduzéieren a Genauegkeet Erhéijung. Wann Fuerscher duerzou Leit mat verschiddene Wahrscheinlechkeeten vun Inclusioun wielt, sinn dann Ännerung waren der distortions vun de spezielle Prozess ëmmer ze réckgängeg. An anere Wierder, wéi mer aus enger Prouf generalize hängt wéi d'Prouf ausgewielt gouf.

Zum Beispill, ass d'Aktuell Bevëlkerung Survey (Nëmmen) vun der US Regierung benotzt de Chômage ze schätzen. All Mount iwwer 100.000 Leit interviewt ginn, entweder-ze-Gesiicht oder iwwer den Telefon, an d'Resultater ginn déi geschate Chômagetaux ze produzéieren. Well d'Regierung de Chômagetaux zu all Stat ze schätzen Wënsch, et kann een net einfach zoufälleg Prouf vun Erwuessener do, well dat ze wéineg Interviewten zu Staaten mat klenge Populatiounen (zB, Rhode Island) nozeginn wier an ze vill vun Staaten mat grouss Populatiounen (zB Kalifornien). Amplaz, genannt de Nëmmen Echantillon Leit an verschidden Staaten bei verschiddenen Tariffer, e Prozess stratified probéieren mat ongläich Probabilitéit vun Auswiel. Zum Beispill, nach wann d'Nëmmen 2.000 Interviewten pro Staat, dann Erwuessener zu Rhode Island géif ronn 30 Mol méi héich Probabilitéit vun Inclusioun wéi Erwuessener am California (Rhode Island: 2.000 Interviewten pro 800.000 Erwuessener vs Kalifornien: 2.000 Interviewten pro 30.000.000 Erwuessener) hunn. Well mir spéider gesinn gëtt, geschitt dat Zort vun probéieren mat ongläich Wahrscheinlechkeet mat online Quelle vun Donnéeën ze, mä am Géigesaz zu der Nëmmen, ass de spezielle Mechanismus normalerweis net oder vun de Fuerscher kontrolléiert bekannt.

Ubetruecht vun sengen probéieren Design, ass de Nëmmen net direkt Vertrieder vun der US; et ënner anerem vill Leit aus Rhode Island an ze wéineg aus Kalifornien. Dofir, géif et dengen ginn de Chômage an d'Land mat de Chômage an d'Prouf ze schätzen. Amplaz vun der Prouf heeschen, ass et besser an enger déifgräifender Kris bedeit ze huelen, wou d'Gewiichter fir der Tatsaach Rechnung, datt Leit aus Rhode Island méi wahrscheinlech goufen wéi Leit aus Kalifornien abegraff gin. Zum Beispill, all Persoun aus Kalifornien wier upweighted- se méi am Devis-an all Persoun vu Rhode Island wier downweighted-si ziele géif wier manner am Devis zielen. An Essenz, sidd Dir méi Stëmm fir Leit kritt, datt Dir manner Chancen iwwert ze léieren.

Dëst Zil Beispill illustréiert eng wichteg mee allgemeng Websäit Punkt: e Beispill vun engem net Mini Versioun vun der Populatioun an Uerdnung gutt Schätzunge ze produzéieren gin brauch. Wann genuch iwwer ass bekannt wéi den Daten gesammelt huet, da kann dat Informatiounen benotzt ginn wann Schätzunge vun der Prouf nees. D'Approche Ech hu just beschriwwen-an dass ech mathematically am technesch beschreiwen komm-Falen squarely bannent der klassescher Probabilitéit spezielle Kader. Elo hun, ech weisen, wéi déi selwecht Idee kënnt, fir Net-Probabilitéit Echantillon applizéiert ginn.