3.4.2 Mitte-valimid: kaalumine

See tõlge loodi arvuti. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 Mitte-valimid: kaalumine

Mitte-valimid, kaalu saab tagasi võtta moonutusi eeldatud valimivõtmisele.

Samamoodi, et teadlased kaalu vastuseid valimid, võivad nad ka kaalu vastuseid suitsetamine valimid. Näiteks kui alternatiiv CPS, kujutlege, et panna banner reklaami tuhandeid veebilehti, et värvata osalejaid uuring, et hinnata tööpuudus. Loomulikult, siis oleks skeptiline, et lihtsate keskmine oma proovi oleks hea hinnangu tööpuudus. Teie skeptitsismi põhjuseks on tõenäoliselt te arvate, et mõned inimesed on tõenäolisem, et täita oma uuringus kui teised. Näiteks inimesed, kes ei kuluta palju aega netis on vähem tõenäoline, et täiendada oma uuringus.

Nagu nägime viimases osas, aga kui me teame, kuidas valim-nagu teeme valimid-siis saame tagasi võtta moonutusi valimivõtmisele. Kahjuks töötades mitte-valimid, me ei tea, kuidas valim. Aga me saame teha oletusi valimivõtmisele ja siis kaalumine samamoodi. Kui need eeldused on õiged, siis kaalumine undo põhjustatavaid valimivõtmisele.

Näiteks, kujutage ette, et vastuseks oma bänner reklaame, siis tööle 100000 vastanutest. Kuid te ei usu, et need 100000 vastanutest on lihtne juhuslik Ameerika täiskasvanutest. Tegelikult, kui võrrelda oma vastanutest USA elanikkonnast, leiad, et inimesed mõned riigid (nt New York) üleesindatud ning et inimesed mõned riigid (nt Alaska) on alaesindatud. Seega on tööpuudus oma proov on tõenäoliselt halb prognoos tööpuudus sihtrühma.

Üks võimalus undo moonutused, mis juhtus valimivõtmisele on anda kaalu igale isikule; väiksem kaal inimestega riigid, mis on üleesindatud proovi (nt New York) ja suurema kaaluga inimestele nendest riikidest, alaesindatud proovi (nt Alaska). Täpsemalt massina iga vastaja on seotud nende esinemissagedust näidiskontole võrreldes nende esinemissagedus USA elanikkonnast. See kaalumine protseduuri nimetatakse järelkihistamisega ja idee kaalumist peaks meelde näiteks jaos 3.4.1, kus vastajate Rhode Island anti vähem kaalu kui vastajate California. Järelkihistamisega eeldab, et sa tead piisavalt, et oma vastajad gruppidesse ja teada osakaal sihtrühmas igas rühmas.

Kuigi kaalumine tõenäosusega proovi ja mitte tõenäosuse valimis on samad matemaatiliselt (vt tehniline lisa), nad töötavad hästi erinevates olukordades. Kui teadlane on täiuslik tõenäosusega proovi (st levi ei ole viga ja ei ole vastust), siis kaalumine hakkab tootma erapooletu hinnangud kõik tunnused kõikidel juhtudel. See tugev teoreetiline garantii on põhjus, miks toetajad valimid neid leida nii atraktiivne. Teiselt poolt, kaalumine mitte-valimid tootma ainult erapooletu hinnangul kõigi tunnuste kui vastus kalduvusi on kõigile sama igas rühmas. Teisisõnu, mõeldes tagasi meie näiteks järelkihistamisega hakkab tootma erapooletu hinnanguid, kui igaüks New York on sama tõenäosus osalevad ja igaüks Alaska on sama tõenäosus osalevad ja nii edasi. See oletus nimetatakse homogeenseks-vastus-kalduvuste-sees-rühmade eeldusel, ja see mängib olulist rolli, teades, kui järelkihistamisega töötab hästi mitte-valimid.

Kahjuks meie näites on homogeenne-vastus-kalduvuste-sees-rühmade eeldus tundub ebatõenäoline, et olla tõsi. See tähendab, et on ebatõenäoline, et kõik Alaska on sama tõenäosusega oma uuringus. Aga seal on kolm olulist aspekti meeles pidada umbes järelkihistamisega, mis kõik teha tundub paljulubava.

Esiteks, homogeenne-vastus-kalduvuste-sees-rühmade eeldusel muutub usutav, rühmade arv suureneb. Ja teadlaste ei piirdu rühmad just põhineb ühe geograafilisi mõõtmeid. Näiteks võiksime luua rühmad põhineb riigi, vanus, sugu ja haridustase. Tundub rohkem usutav, et seal on homogeenne vastuseks kalduvusi rühmas 18-29, female, kolledži lõpetajate elavad Alaska kui rühmas kõik inimesed, kes elavad Alaska. Seega, kui rühmade arv kasutada järelkihistamisega suureneb eelduste vaja toetada muutunud mõistlik. Arvestades seda asjaolu, tundub nagu teadlased tahaksid luua tohutu hulk rühmad järelkihistamisega. Aga nagu rühmade arv suureneb, teadlased sattunud erineva probleemi: andmete hõredus. Kui seal on vaid väike hulk inimesi igas grupis, siis hinnangud on rohkem ebakindel ja äärmuslikul juhul, kui on olemas grupp, mis ei ole vastanutest, siis järelkihistamisega täielikult laguneb. On kaks võimalust sellest omane pingeid usutavust homogeneous- vastus-kalduvuse-sees-rühmade eeldus ja nõudlus mõistliku suurusega valimit igas rühmas. Üks võimalus on liikuda keerukamaid statistilisi arvutamise mudeli kaalu ja teine on koguda suurem, mitmekesisem proovi, mis aitab tagada mõistlik valimi suuruse igas rühmas. Ja mõnikord teadlased teha nii, nagu ma kirjeldada üksikasjalikumalt allpool.

Teine kaalutlus töötades järelkihistamisega mitte-valimid on see, et homogeenne-vastus-kalduvuse-sees-rühmade eelduseks on juba sageli tehtud analüüsides valimid. Põhjus, miks see eeldus on vaja valimid praktikas on see, et valimid on vastamata jätmise ja kõige levinum meetod reguleerimiseks vastamata jätmist on järelkihistamisega nagu eespool kirjeldatud. Muidugi, just seetõttu, et paljud teadlased teevad teatud eeldus ei tähenda, et sa peaksid seda tegema ka. Aga see ei tähenda, et kui võrrelda empiirilist proovide valimid praktikas, peame meeles pidama, et nii sõltuvad eeldused ja lisaandmed, et toota hinnanguid. Enamikul realistlik seadeid, lihtsalt ei ole eeldus-vaba lähenemine järeldamine.

Lõpuks, kui sa hoolid Ühe hinnangu eelkõige-meie näites tööpuudus-siis pead seisukorras nõrgem kui homogeenne-vastus-kalduvuse-sees-rühmade oletus. Täpsemalt, siis ei ole vaja eeldada, et igaühel on sama vastuse kalduvus, pead ainult oletada, et puudub korrelatsioon vastuseks kalduvus ja tööpuudus igas rühmas. Muidugi, isegi seda nõrgem tingimus ei hoia teatud olukordades. Näiteks, kujutage ette osakaalu hindamisel ameeriklased, et teha vabatahtlikku tööd. Kui inimesed, kes teevad vabatahtlikku tööd on tõenäolisem, et on nõus küsitluses, siis teadlased pidevalt üle hinnata, kui palju vabatahtlikku, isegi kui nad järelkihistamisega kohandusi, et tulemus on tõestatud empiiriliselt Abraham, Helms, and Presser (2009) .

Nagu ma ütlesin, mitte-valimid on suhtuda skeptiliselt ühiskonnateadlased, osaliselt seetõttu, et nende roll mõned kõige piinlik ebaõnnestumisi esimestel päevadel uuringu tulemustest. Selge näide, kui kaugele oleme jõudnud mitte-valimid on teadus Wei Wang, David Rothschild, Sharad Goel ja Andrew Gelmani, et õigesti tagasi tulemustest 2012. aasta USA valimiste kasutades empiirilist valimit American Xbox kasutajad -a Absoluutselt mitte juhusliku valimi ameeriklast (Wang et al. 2015) . Teadlased tööle vastanutest Xbox mängude süsteemi ja kui te võite arvata, Xbox proovi viltu mees ja viltu noored: 18-29-aastastest moodustavad 19% valijaskonnast, kuid 65% Xbox proovi ja mehed moodustavad 47% valijaskonnast ja 93% Xbox proovi (joonis 3.4). Kuna need tugevad demograafilised nihked, toores Xbox andmeid oli halb näitaja valimistulemus. See ennustas tugeva võidu Mitt Romney üle Barack Obama. Jällegi, see on järjekordne näide ohtudest toores, korrigeerimata mitte-valimid ja meenutab Kirjanduse Digest fiasko.

Joonis 3.4: Demograafia vastanutest Wang et al. (2015) . Kuna vastajad värvati XBox, nad olid suurema tõenäosusega olla noor ja suurema tõenäosusega mees, suhtelist valijatele 2012. aasta valimisi.

Kuid Wang ja tema kolleegid olid teadlikud nende probleemide ja üritanud kaalu vastanutest korrigeerimiseks valimivõtmisele. Eelkõige kasutasid nad keerukamaid vormis järelkihistamisega ma rääkisin. Tasub õppida natuke rohkem oma lähenemist, sest see ehitab intuitsiooni järelkihistamisega ja konkreetse versiooni Wang ja tema kolleegid kasutatud on üks kõige põnevam lähenemisviise kaalumine mitte-valimid.

Meie lihtne näide selle kohta hinnates töötus jaos 3.4.1 jaotasime elanikkonna rühmadesse põhineb elukohariigis. Seevastu Wang ja tema kolleegid jagatakse elanikkonna kaasamine arvesse 176256 rühmad on määratletud: sugu (2 kategooriad), rassi (4 kategooriasse), vanus (4 kategooriasse), haridus (4 kategooriasse), riik (51 kategooriat), pool ID (3 kategooria), ideoloogia (3 kategooria) ja 2008. hääletusel (3 kategooriasse). Rohkem rühmi, teadlased lootust, et see oleks üha tõenäolisem, et igas rühmas on vastus kalduvus oli mittekorreleerunud toetus Obama. Järgmine, mitte ehitamise üksikisiku tasandil kaalud, nagu tegime meie näites, Wang ja tema kolleegid kasutasid keerulisi hindamise mudelit inimeste osakaal, iga rühma, mis oleks hääletanud Obama. Lõpuks nad kokku need grupi hinnangutest toetust teadaoleva suuruse iga rühma toota hinnangulise toetuse tase. Teisisõnu, nad tükeldatud elanikkonnast erinevatesse gruppidesse, hinnanguliselt toetus Obama igas grupis ning siis võttis kaalutud keskmine rühm hinnanguid koostama üldise hinnangu.

Nii suur väljakutse oma lähenemine on hinnata toetust Obama kõigis nendes 176256 rühmad. Kuigi nende paneel sisaldas 345.858 unikaalset osalejat, tohutu hulk standardite järgi valimiste valijate oli palju, palju rühmi, mille Wang ja tema kolleegid peaaegu ei olnud vastajatest. Seepärast, et hinnata toetuse igas grupis nad kasutasid tehnikat nimega mitmetasandiline regressiooni järelkihistamisega, millest teadlased hellalt helistada hr P. Sisuliselt hinnata toetust Obama jooksul teatud grupp, hr P. basseinid teavet paljude tihedalt seotud rühmad. Näiteks leiavad väljakutse hindamisel toetust Obama naiste hulgas, latiinod, vahel 18-29 aastat vana, kes on ülikooli lõpetanud, kes on registreeritud demokraadid, kes identifitseerivad end mõõdukad, ning kes hääletasid Obama 2008. See on väga spetsiifilise rühma ja on võimalik, et keegi ei proovi nende omadustega. Seetõttu andma hinnanguid selle nimel, hr P. basseinid koos hinnangul on inimesed väga sarnased rühmad.

Kasutades seda analüüsi strateegia, Wang ja tema kolleegid suutsid kasutada XBox empiirilist proovi väga tihedalt hinnata üldist toetust, et Obama sai 2012. aasta valimistel (joonis 3.5). Tegelikult nende hinnangud olid täpsemad kui agregaat avaliku arvamuse küsitlused. Seega, antud juhul kaalu-spetsiaalselt hr P.-tundub teevad head tööd parandatakse peensusi mitte-tõenäosus andmed; peensusi, mis on nähtav, kui te vaatate hinnangute korrigeerimata Xbox andmeid.

Joonis 3.5: hinnangute Wang et al. (2015) . Korrigeerimata XBox proovi toodetud ebaõigeid hinnanguid. Aga kaalutud XBox proovi toodetud hinnanguid, mis olid täpsemad kui keskmine tõenäosus põhinev telefoni-uuringud.

On kaks peamist lugu uuringust Wang ja tema kolleegid. Esiteks korrigeerimata mitte-valimid võib põhjustada halb prognoosid; See on õppetund, et paljud teadlased on varem kuulnud. Kuid teine õppetund on see, et mitte-valimid, kui kaalutud korralikult, võib tegelikult anda päris hea hinnanguid. Tegelikult on nende hinnangud olid täpsem kui hinnangute pollster.com, liitmise traditsiooniliste valimiste eelhääletamise.

Lõpuks on olulised puudused, mida saame sellest õppida ühe konkreetse uuringu. Just sellepärast järelkihistamisega hästi toiminud Antud juhul ei ole mingit garantiid, et see töötab hästi muudel juhtudel. Tegelikult valimised on ilmselt üks lihtsamaid seadeid sest pollsters õppinud valimised peaaegu 100 aastat, on regulaarselt tagasisidet (saame näha, kes võidab valimised), ja pool identifitseerimise ja demograafilised näitajad on suhteliselt ennustav hääletamise. Sel hetkel, puudub tahke ja empiirilised kogemused teadma, kui kaalutakse muudatusi mitte-valimid hakkab tootma piisavalt täpsed hinnangud. Üks asi, mis on selge, aga kui teil on sunnitud töötama mitte-valimid, siis on piisavalt põhjust uskuda, et kohandatud prognoosid on parem kui mitte kohandatud hinnanguid.