3.4.3 eșantioane non-probabilitate: potrivirea eșantionului

Nu toate probele non-probabilistice sunt aceleași. Putem adăuga mai mult control pe front - end.

Abordării Wang si colegii sai au folosit pentru a estima rezultatul 2012 alegerile prezidentiale din SUA a depins în totalitate de îmbunătățiri în analiza datelor. Asta este, au colectat cât mai multe răspunsuri cât au putut și apoi a încercat să re-greutate ei. O strategie complementară pentru lucrul cu eșantionarea non-probabilitate este de a avea mai mult control asupra procesului de colectare a datelor.

Cel mai simplu exemplu al unui proces de eșantionare non-probabilitate parțial controlată este eșantionarea cotă, o tehnică care merge înapoi la primele zile ale cercetării sondajului. În cotă de eșantionare, cercetătorii împărți populația în grupuri diferite (de exemplu, bărbați tineri, femei tinere, etc.) și apoi setați cotele pentru numărul de persoane care urmează să fie selectate în fiecare grup. Respondenții sunt selectați într-un mod haotic, până când cercetătorul a îndeplinit cota lor în fiecare grup. Din cauza cotelor, eșantionul rezultat pare mai mult ca populația țintă decât ar fi adevărat altfel, ci pentru că probabilitățile de includere sunt necunoscute, mulți cercetători sunt sceptici cu privire la metoda eșantionării pe cote. De fapt, eșantionarea cotă a fost o cauza a "Dewey Înfrângeri Truman" eroare în 1948 sondajele prezidențiale din SUA. Deoarece acesta oferă un anumit control asupra procesului de eșantionare, cu toate acestea, se poate observa modul în care eșantionarea cotă ar putea avea unele avantaje față de o colecție de date complet necontrolat.

Se deplasează dincolo de eșantionare cotă, abordări mai moderne pentru controlarea procesului de eșantionare non-probabilitate sunt acum posibile. O astfel de abordare este numită de potrivire a eșantionului, și este utilizat de către unii furnizori comerciali panel online. În forma sa cea mai simplă, de potrivire eșantion necesită două surse de date: 1) un registru complet al populației și 2) un grup mare de voluntari. Este important ca voluntarii nu trebuie să fie o mostră de probabilitate de la orice populație; pentru a sublinia faptul că nu există cerințe pentru selecția în panoul, am să - l numesc un panou murdar. De asemenea, atât registrul populației și panoul murdar trebuie să includă unele informații auxiliare despre fiecare persoană, în acest exemplu, voi lua în considerare vârsta și sexul, dar în situații reale, aceste informații auxiliare ar putea fi mult mai detaliate. Truc de potrivire a eșantionului este de a selecta mostre dintr - un panou murdar într - un mod care produce probe care arata ca mostre de probabilitate.

Proba de potrivire începe atunci când un eșantion de probabilitate simulat este luată din registrul populației; această probă simulat devine o probă de țintă. Apoi, pe baza informațiilor auxiliare, cazuri în eșantionul țintă sunt potrivite pentru persoanele din panoul murdar pentru a forma o probă de potrivire. De exemplu, în cazul în care există o femeie în vârstă de 25 an, în eșantionul țintă, atunci cercetătorul găsește o femeie de 25 de ani de la panoul de murdar, pentru a face parte din eșantion potrivit. În cele din urmă, membrii eșantionului potrivite sunt intervievați pentru a produce un set final de respondenți.

Chiar dacă proba de potrivire arata ca eșantionul țintă, este important să ne amintim că eșantionul potrivit nu este o probă de probabilitate. eșantioane potrivite se pot asocia numai eșantionul țintă pe informațiile cunoscute auxiliare (de exemplu, vârsta și sexul), dar nu și pe caracteristicile nemăsurate. De exemplu, în cazul în care oamenii de pe panoul murdar tind să fie mai sărac la urma urmei, un motiv să se alăture unui panou de sondaj este de a câștiga bani, atunci, chiar dacă proba de potrivire arata ca eșantionul țintă în ceea ce privește vârsta și sexul va avea în continuare o prejudecata fata de oameni săraci. Magia de prelevare a probelor de probabilitate adevărată este de a exclude probleme pe ambele caracteristici măsurate și nemăsurate (un punct care este în concordanță cu discuția noastră de potrivire pentru inferență cauzală din studiile observaționale în Capitolul 2).

În practică, potrivirea eșantionului depinde de a avea un panou mare și divers dornici de a finaliza studiile, și astfel se face în principal de către companiile care își pot permite să dezvolte și să mențină o astfel de panou. De asemenea, în practică, pot exista probleme cu potrivirea (uneori, un meci bun pentru cineva din eșantionul țintă nu exista pe panoul) și non-răspuns (uneori persoanele din eșantion potrivit refuză să participe la sondaj). Prin urmare, în practică, cercetătorii fac de potrivire eșantion, de asemenea, efectua un fel de ajustare post-stratificare pentru a face estimări.

Este greu de a oferi garanții teoretice utile cu privire la potrivirea eșantionului, dar în practică se poate efectua bine. De exemplu, Stephen Ansolabehere și Brian Schaffner (2014) , comparativ cu trei studii paralele de aproximativ 1.000 de persoane efectuate în 2010 , folosind trei prelevare de probe diferite si interviuri metode: e - mail, telefon și un panou de Internet utilizând potrivirea eșantionului și ajustarea post-stratificare. Estimările din cele trei abordări au fost destul de similare cu cele de la valori de referință de înaltă calitate, cum ar fi Ancheta actuală a populației (CPS) si National de Sanatate Interviu Survey (NHIS). Mai precis, atat sondajele Internet si e-mail au fost în afara de o medie de 3 puncte procentuale, iar sondajul telefonic a fost oprit cu 4 puncte procentuale. Erori de acest mare sunt aproximativ ceea ce s-ar aștepta de la eșantioane de aproximativ 1.000 de persoane. Cu toate că, nici unul dintre aceste moduri de produse date în mod substanțial mai bune, atât sondajul prin Internet și telefon (care a avut zile sau săptămâni) au fost în mod substanțial mai rapid la câmp decât studiul e-mail (care a durat opt ​​luni), iar sondajul de Internet, care a folosit potrivirea eșantionului, a fost mai ieftin decât celelalte două moduri.

In concluzie, oamenii de știință sociale și statisticieni sunt incredibil de sceptici de concluzii din aceste eșantioane non-probabilitate, în parte , deoarece acestea sunt asociate cu unele eșecuri jenante ale cercetării sondajului , cum ar fi sondajul literar Digest. În parte, sunt de acord cu acest scepticism: neajustate eșantioane non-probabilitate sunt susceptibile de a produce estimări proaste. Cu toate acestea, în cazul în care cercetătorii pot ajusta pentru deviatiilor în procesul de eșantionare (de exemplu, după stratificarea) sau controlează procesul de eșantionare oarecum (de exemplu potrivirea probă), ele pot produce estimări mai bune și chiar estimările de calitate suficientă pentru majoritatea scopurilor. Desigur, ar fi mai bine să facă prelevarea de probe de probabilitate executate perfect, dar care nu mai pare a fi o opțiune realistă.

Ambele probe de bază non-probabilitate și mostre de probabilitate variază în calitatea lor, iar în prezent este probabil cazul în care cele mai multe estimări din mostre de probabilitate sunt mai fiabile decât estimările din probele non-probabilitate. Dar chiar și acum, estimările din probe de bază non-probabilitate bine realizate sunt, probabil, mai bune decât estimările din probele de probabilitate prost efectuate. Mai mult, probele non-probabilistice sunt substanțial mai ieftine. Astfel, se pare că probabilitatea față de eșantionare non-probabilitate oferă un cost-calitate comerț-off (Figura 3.6). Privind în perspectivă, mă aștept că estimările din probele non-probabilitate bine facut vor deveni mai ieftine și mai bune. În plus, din cauza defalcarea în sondaje telefonice fixe și ratele de creștere ale non-răspuns, mă aștept ca mostre de probabilitate vor deveni mai scumpe și de calitate inferioară. Din cauza acestor tendințe pe termen lung, cred că prelevarea de probe de bază non-probabilitate va deveni tot mai important în a treia era de cercetare sondaj.

Figura 3.6: Probabilitatea de prelevare a probelor în practică și de eșantionare non-probabilitate sunt cele două mari categorii, eterogene. În general, există un cost-eroare de compromis cu eșantionare non-probabilitate fiind un cost mai mic, dar mai mare de eroare. Cu toate acestea, bine făcut-eșantionare non-probabilitate poate produce estimări mai bune decât cele de eșantionare de probabilitate prost făcut. În viitor, mă aștept ca eșantionarea non-probabilitate va primi mai bine și mai ieftin în timp ce probabilitatea de eșantionare se va agrava și mai scumpe.

Figura 3.6: Probabilitatea de prelevare a probelor în practică și de eșantionare non-probabilitate sunt cele două mari categorii, eterogene. În general, există un cost-eroare de compromis cu eșantionare non-probabilitate fiind un cost mai mic, dar mai mare de eroare. Cu toate acestea, bine făcut-eșantionare non-probabilitate poate produce estimări mai bune decât cele de eșantionare de probabilitate prost făcut. În viitor, mă aștept ca eșantionarea non-probabilitate va primi mai bine și mai ieftin în timp ce probabilitatea de eșantionare se va agrava și mai scumpe.