3.4.3 Nicht-Wahrscheinlichkeitsstichproben: Probenanpassung

Diese Übersetzung wurde von einem Computer erstellt. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.3 Nicht-Wahrscheinlichkeitsstichproben: Probenanpassung

Nicht alle nicht-Wahrscheinlichkeits Proben sind die gleichen. Wir können mehr Kontrolle auf dem vorderen Ende hinzuzufügen.

Der Ansatz Wang und Kollegen nutzten das Ergebnis der 2012 US-Präsidentschaftswahl zu schätzen, hing ganz auf Verbesserungen bei der Datenanalyse. Das heißt, sammelten sie so viele Antworten, wie sie konnten, und dann versucht, sie wieder zu Gewicht. Eine ergänzende Strategie für mit Nicht-Wahrscheinlichkeitsstichproben arbeiten ist, um mehr Kontrolle über die Datensammlung haben.

Das einfachste Beispiel eines teilweise gesteuert Nicht Wahrscheinlichkeit Probenahme ist Quotenauswahl, eine Technik , die zurück zu den Anfängen der Umfrageforschung geht. In Quotenauswahl, Forscher unterteilen die Bevölkerung in verschiedene Gruppen (zB junge Männer, junge Frauen, usw.) und dann Quotenvorgaben für die Anzahl der Personen in jeder Gruppe ausgewählt werden. Die Befragten werden in einer zufälligen Art und Weise ausgewählt, bis die Forscher ihre Quote in jeder Gruppe erfüllt hat. Aufgrund der Quoten, sieht die resultierende Probe mehr wie die Bevölkerung Ziel als sonst wahr wäre, sondern weil die Wahrscheinlichkeiten der Inklusion sind unbekannt sind viele Forscher von Quotenauswahl skeptisch. In der Tat war Quotenauswahl eine Ursache für die "Dewey besiegt Truman" Fehler in den 1948 US-Präsidentschaftswahlen. Weil es eine gewisse Kontrolle über die Sampling-Prozess sieht jedoch vor, kann man sehen, wie Quotenauswahl einige Vorteile gegenüber einer völlig unkontrollierten Datensammlung haben könnte.

Jenseits Quotenauswahl, modernere Ansätze zur Steuerung der Nicht-Zufallsstichprobenprozess sind nun möglich. Ein solcher Ansatz wird die Probe Anpassung genannt, und es wird von einigen kommerziellen Online - Panel - Anbieter verwendet. In seiner einfachsten Form erfordert Probe Matching zwei Datenquellen: 1) ein vollständiges Register der Bevölkerung und 2) eine große Gruppe von Freiwilligen. Es ist wichtig, dass die Freiwilligen nicht brauchen, eine Zufallsstichprobe von jeder Population zu sein; zu betonen , dass keine Anforderungen für die Auswahl in das Panel gibt es, es werde ich ein schmutziges Panel aufrufen. Auch sind sowohl die Bevölkerungsregister und das schmutzige Panel muss einige Zusatzinformationen über jede Person umfassen, in diesem Beispiel werde ich prüfen, Alter und Geschlecht, aber in realistischen Situationen diese Zusatzinformationen könnte viel detaillierter sein. Der Trick der Probe Matching Proben von einem schmutzigen Platte in einer Art und Weise zu wählen , die Proben erzeugt , die wie Wahrscheinlichkeitsstichproben aussehen.

Beispielanpassung beginnt, wenn eine simulierte Wahrscheinlichkeit Probe aus dem Bevölkerungsregister aufgenommen wird; Diese simulierte Probe wird zu einer Zielprobe. Dann wird , basierend auf der Hilfsinformation, Fälle in der Zielprobe , um Menschen in der schmutzigen Platte abgestimmt eine angepaßte Probe zu bilden. Zum Beispiel, wenn es eine 25-jährige Frau in der Zielstichprobe ist, dann findet der Forscher eine 25-jährige Frau aus dem schmutzigen Platte in dem angepassten Probe zu sein. Schließlich werden die Mitglieder der angepassten Probe ein Interview mit dem letzten Satz der Befragten zu erzeugen.

Auch wenn die abgestimmte Probe wie die Zielprobe aussieht, ist es wichtig, sich daran zu erinnern, dass die angepasste Probe kein Zufallsstichprobe ist. Matched Proben kann nur auf der bekannten Hilfsinformation (beispielsweise Alter und Geschlecht), um die Zielprobe übereinstimmen, aber nicht auf nicht gemessene Eigenschaften. wenn die Menschen auf der schmutzigen Platte zum Beispiel neigen dazu, schlechtere immerhin ein Grund, ein Umfrage-Panel zu verbinden ist Geld dann zu verdienen, auch wenn die abgestimmte Probe wie die Probe Ziel sieht in Bezug auf Alter und Geschlecht wird es noch haben eine Tendenz zu schlechten Menschen. Die Magie der wahren Wahrscheinlichkeit Probenahme Probleme auf beiden gemessenen und nicht gemessenen Eigenschaften auszuschließen (einen Punkt, der mit unserer Diskussion Sortierens kausalen Inferenz aus Beobachtungsstudien in Kapitel 2 konsistent ist).

In der Praxis hängt Probe Anpassung eine große und vielfältige Platte auf, die eifrig an Umfragen zu beteiligen, und damit wird es vor allem von Unternehmen durchgeführt, die eine solche Platte zu entwickeln und zu pflegen leisten können. Auch in der Praxis kann es Probleme mit dem passenden (manchmal ein gutes Spiel für jemanden in der Zielprobe nicht auf der Platte vorhanden sind) und ein Nichtansprechen (manchmal Menschen in der angepassten Probe verweigern, an der Umfrage teilnehmen). Daher wird in der Praxis Forscher Probe Matching tun auch eine Art post-Schichtung Anpassung durchführen, um Schätzungen zu machen.

Es ist schwer, nützliche theoretische Garantien Probe Anpassung zur Verfügung zu stellen, aber in der Praxis kann es gut durchführen. Zum Beispiel Stephen Ansolabehere und Brian Schaffner (2014) verglichen drei parallelen Erhebungen von etwa 1.000 Menschen im Jahr 2010 durchgeführt , drei verschiedene Stichproben herangezogen und Befragungsmethoden: Post, Telefon und Internet - Panel mit Musteranpassung und post-Schichtung Einstellung. Die Schätzungen der drei Ansätze waren ganz ähnlich wie die Schätzungen von qualitativ hochwertigen Benchmarks wie dem Current Population Survey (CPS) und der National Health Interview Survey (NHIS). Genauer gesagt, die sowohl Internet und E-Mail-Umfragen waren um durchschnittlich 3 Prozentpunkte und die Telefon-Umfrage war off um 4 Prozentpunkte ab. Fehler dieser groß sind ungefähr das, was man aus Proben von etwa 1.000 Menschen erwarten würde. Obwohl keines dieser wesentlich bessere Daten erzeugt Modi, sowohl das Internet und Telefon-Umfrage (die Tage oder Wochen in Anspruch nahm) wesentlich schneller zu Feld waren, als die E-Mail-Umfrage (das acht Monate in Anspruch nahm) und die Internet-Umfrage, die Probe Anpassung verwendet, war billiger als die beiden anderen Modi.

Abschließend sind die Sozialwissenschaftler und Statistiker unglaublich skeptisch Schlüsse aus diesen nicht-Wahrscheinlichkeitsstichproben, zum Teil , weil sie mit einigen peinlichen Fehlern der Umfrageforschung wie der Literary Digest Umfrage zugeordnet sind. Im zweiten Teil bin ich mit dieser Skepsis: nicht angepasste Nicht-Zufallsstichproben sind wahrscheinlich schlechte Schätzungen zu erzeugen. wenn Forscher können jedoch für die Verzerrungen im Bemusterungsprozess anpassen (zB Post-Schichtung) oder die Sampling-Prozess zu steuern etwas (zB Probe-Matching), können sie bessere Schätzungen und sogar Schätzungen von ausreichender Qualität für die meisten Zwecke produzieren. Natürlich wäre es besser, perfekt ausgeführt Wahrscheinlichkeitsstichproben zu tun, aber das wird nicht mehr eine realistische Option zu sein.

Sowohl Nicht-Zufallsstichproben und Wahrscheinlichkeitsstichproben unterscheiden sich in ihrer Qualität, und zur Zeit ist es wahrscheinlich der Fall, dass die meisten Schätzungen von Wahrscheinlichkeitsstichproben sind vertrauenswürdiger als Schätzungen von Nicht-Zufallsstichproben. Aber selbst jetzt, Schätzungen aus gut durchgeführten Nicht-Zufallsstichproben sind wahrscheinlich besser als Schätzungen von schlecht durchgeführte Wahrscheinlichkeitsstichproben. Weiterhin sind nicht-Wahrscheinlichkeit Proben wesentlich billiger. So scheint es, dass Wahrscheinlichkeit vs nicht Wahrscheinlichkeitsstichproben bietet eine kostengünstige Qualität trade-off (Abbildung 3.6). Wir freuen uns, erwarte ich, dass die Schätzungen von gut gemachte Nicht Wahrscheinlichkeit Proben werden billiger und besser geworden. Ferner kann, da der Abbau in Festnetz-Telefonumfragen und steigende Preise von Nicht-Reaktion, erwarte ich, dass Wahrscheinlichkeitsstichproben teurer wird und von geringerer Qualität. Aufgrund dieser langfristigen Trends, denke ich, dass nicht-Wahrscheinlichkeitsstichproben immer mehr an Bedeutung in der dritten Ära der Umfrageforschung wird.

Abbildung 3.6: Wahrscheinlichkeitsstichprobe in der Praxis und nicht-Wahrscheinlichkeitsstichproben sind beide großen, heterogenen Kategorien. In der Regel gibt es einen kosten Fehler Trade-off mit nicht-Wahrscheinlichkeitsstichproben geringeren Kosten zu sein, aber höher Fehler. Doch gut gemachte nicht Wahrscheinlichkeitsstichproben eine bessere Einschätzung als schlecht gemachte Wahrscheinlichkeitsstichproben produzieren kann. In Zukunft erwarte ich, dass nicht-Wahrscheinlichkeitsstichprobe wird besser und billiger, während Wahrscheinlichkeit Probenahme schlechter und teurer zu bekommen.