3.4.2 Не-случайни извадки: претегляне

Този превод е създаден от компютър. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 Не-случайни извадки: претегляне

С не-случайни извадки, тежести може да се отмени нарушения, предизвикани от процеса на приема за вземане на проби.

По същия начин, че изследователите на тегло отговори от случайни извадки, те също могат да тегло отговори от не-случайни извадки. Например, като алтернатива на CPS, представете си, че сте поставени рекламни банери на хиляди сайтове за набиране на участници за проучване, за да се оцени нивото на безработица. Естествено, вие ще бъдете скептични, че проста средна стойност на вашия проба ще бъде добра оценка за нивото на безработицата. Вашият скептицизъм е вероятно, защото мислите, че някои хора са по-склонни да завърши проучването си, отколкото другите. Например, хората, които не прекарват много време в интернет, са по-малко склонни да попълните анкета.

Както видяхме в последната част, обаче, ако знаем как пробата е била избрана, както правим с случайни извадки-после можем да отмените нарушения, предизвикани от процеса на вземане на проби. За съжаление, когато се работи с не-случайни извадки, ние не знаем как е бил избран пробата. Но, ние можем да направим предположения за процеса на вземане на проби и след това се прилага корекционен коефициент, по същия начин. Ако тези предположения са верни, тогава тежестта ще отмените изкривяванията, причинени от процеса на вземане на проби.

Например, представете си, че в отговор на вашите рекламни банери, можете наети 100,000 респонденти. Въпреки това, вие не вярвате, че тези 100,000 респондентите са проста случайна извадка от възрастните американци. В действителност, когато се сравни респондентите си към населението на САЩ, ще откриете, че хората от някои държави (например, Ню Йорк), са много по-често и, че хората от някои държави (например, Alaska) са по-слабо представени. По този начин, нивото на безработица на вашата проба е вероятно да бъде по-лоша оценка за нивото на безработицата в целевата популация.

Един от начините да отмените изкривяването, което се случи в процеса на вземане на проби е да се възложи тегла на всеки човек; по-ниски тегла на хора от държави, които са по-силно представени в пробата (например, Ню Йорк) и по-високи тегла на хора от държави, които са по-слабо представени в пробата (например, Аляска). По-конкретно, теглото на всеки респондент е свързано с тяхното разпространение във вашата проба спрямо разпространението им в населението на САЩ. Тази процедура за претегляне се нарича пост-стратификация, и идеята за претегляне трябва да ви напомня за примера в раздел 3.4.1, където респондентите от Роуд Айлънд са били дадени по-малко тегло от респондентите от Калифорния. Post-стратификация изисква от вас да знае достатъчно, за да сложи респондентите си в групи и да се знае, делът на целевото население във всяка група.

Въпреки, че претеглянето на извадката на вероятностите и на пробата за не-вероятно са едни и същи математически (виж техническо приложение), те работят добре в различни ситуации. Ако изследователят има перфектен вероятност проба (т.е., няма грешка покритие и не на липсата на отговор), след претегляне ще произвежда непредубедени оценки за всички черти във всички случаи. Тази силна теоретична гаранция защо поддръжниците на случайни извадки ги намират за толкова привлекателна. От друга страна, претегляне проби неслучайни ще произвеждат само непредубедени оценки за всички черти, ако наклонности на отговор са еднакви за всички, във всяка група. С други думи, мисли обратно към нашия пример, с помощта на пост-стратификация ще произвежда безпристрастни оценки, ако всички в Ню Йорк има еднаква вероятност за участие и всички в Аляска има еднаква вероятност за участие и така нататък. Това предположение се нарича предположението на хомогенни-реакция-склонности-в-групи, и играе ключова роля в знаейки, ако след стратификация ще работи добре с не-случайни извадки.

За съжаление, в нашия пример, предположението хомогенна-реакция-склонности-рамките-групи изглежда малко вероятно да бъде вярно. Това е, че изглежда малко вероятно, че всички в Аляска има еднаква вероятност да бъде във вашата анкета. Но, има три важни точки, които да имате предвид за пост-стратификация, всички от които я правят да изглежда по-обещаващо.

Първо, хомогенна-реакция-склонности-рамките-групи предположение става все по-правдоподобно, тъй като броят на групите се увеличава. И изследователи не се ограничават до групи, само въз основа на един географски измерения. Например, ние може да се създадат групи на базата на държавна, възраст, пол, и ниво на образование. Тя изглежда по-правдоподобно, че има хомогенни склонности на отговор в рамките на групата на 18-29, завършили жени, колеж, живеещи в Аляска, отколкото в групата на всички хора, живеещи в Аляска. По този начин, тъй като броят на групи, използвани за пост-стратификация се увеличава, допусканията, необходими за подпомагане тя да стане по-разумен. Като се има предвид този факт, тя изглежда като изследователи ще искат да се създаде огромен брой групи за пост-стратификация. Но, тъй като броят на групи увеличава, изследователи работят в друг проблем: оскъдица данни. Ако има само малък брой хора във всяка група, а след това оценките ще бъдат по-несигурни, и в краен случай, когато има една група, която все още няма респонденти, след това пост-стратификация напълно разгражда. Има два начина от този присъщ напрежение между правдоподобността на homogeneous- предположение отговор-склонност-рамките-групи и търсенето на разумни размери на пробите във всяка група. Един от подходите е да се премине към по-сложни статистически модел за изчисляване на тежести, а другият е да се съберат по-голям, по-разнообразна проба, която помага да се гарантира разумни размери на пробите във всяка група. И, понякога изследователите правят и двете, тъй като аз ще опиша по-подробно по-долу.

Втори внимание при работа с пост-стратификация от неслучайни извадки, е, че предположението хомогенна-отговор-склонност-рамките-групи вече е често направени при анализа на случайни извадки. Причината, че е необходимо това предположение за случайни извадки на практика е, че случайни извадки имат липса на отговор, и най-разпространеният метод за регулиране на неотговорилите е пост-стратификация, както е описано по-горе. Разбира се, само защото много изследователи правят определен предположение не означава, че трябва да го направя прекалено. Но това не означава, че когато се сравняват неслучайни извадки, за случайни извадки на практика, ние трябва да помним, че и двете зависят от предположения и помощна информация, за да се произведе оценки. В най-реалистични настройки, просто няма предположение-свободен подход към извод.

И накрая, ако ви е грижа за една оценка по-специално в нашия пример безработицата скоростта тогава имате нужда от състояние по-слаба от хомогенни-реакция-склонност-в-групи предположение. По-конкретно, не е нужно да се предположи, че всеки има същата склонност отговор, само трябва да се приеме, че няма никаква връзка между склонността отговор и нивото на безработица в рамките на всяка група. Разбира се, дори и тази по-слаба състояние няма да се задържи в някои ситуации. Например, представете си, определянето на пропорцията на американците, които правят доброволен труд. Ако хората, които правят доброволен труд са по-склонни да се съгласят да бъдат в едно проучване, след това изследователите ще систематично над-изчислите сумата на доброволчеството, дори и ако го направят корекции след стратификация, в резултат на което е доказано емпирично чрез Abraham, Helms, and Presser (2009) .

Както казах по-рано, не са случайни извадки са гледани с голям скептицизъм от социолози, отчасти поради тяхната роля в някои от най-смущаващите провали в първите дни на изследователското. Ясен пример за това колко далеч сме стигнали с неслучайни извадки, е изследването на Wei Wang, Дейвид Ротшилд, Шарад Goel, и Андрю Гелмановата че правилно възстановена резултата от US избори 2012 с помощта на не-случайна извадка от потребители American Xbox -а определено не-случайна извадка от американците (Wang et al. 2015) . Изследователите наети респонденти от системата за XBox игри, и както може да се очаква, пробата за Xbox изкривена мъжки и изопачени млад: 18-29 годишните, които съставляват 19% от избирателите, а 65% от извадката Xbox и мъжете съставляват 47% от избирателите и 93% от извадката Xbox (Фигура 3.4). Поради тези силни демографски пристрастия, необработените данни Xbox бил лош показател на изборните възвръщаемост. Той прогнозира силна победа за Мит Ромни над Барак Обама. Отново, това е още един пример за опасностите от суровини, некоригирани проби неслучайни и напомня на фиаското на Литературен преглед.

Фигура 3.4: Демографски на респондентите в Wang и др. (2015 г.). Тъй като респондентите са били назначени от XBox, те са по-склонни да си млад и по-вероятно да бъде от мъжки пол, в сравнение с избиратели в изборите 2012 година.

Фигура 3.4: Демографски на респондентите в Wang et al. (2015) . Тъй като респондентите са били назначени от XBox, те са по-склонни да си млад и по-вероятно да бъде от мъжки пол, в сравнение с избиратели в изборите 2012 година.

Въпреки това, Wang и колеги са били наясно с тези проблеми и се опитват да тегло респондентите да се коригира за процеса на вземане на проби. По-специално, те се използват по-сложна форма на пост-стратификация ти казах за. Струва си да се учат малко повече за техния подход, защото тя изгражда интуиция за пост-стратификация, и конкретната версия Wang и колегите използва, е един от най-интересните подходи за претегляне проби неслучайни.

В нашия прост пример за изчисляване на безработицата в раздел 3.4.1, ние разделен на населението в групи въз основа на държавата на пребиваване. За разлика от тях, Wang и колеги разделени на населението в под 176,256 групи, определени от: пол (2 категории), раса (4 категории), възраст (4 категории), образование (4 категории), състояние (51 категории), партия ID (3 категории), идеология (3 категории) и 2008 глас (3 категории). С повече групи, учените се надяват, че това ще бъде все по-вероятно, че в рамките на всяка група, склонност отговор беше несвързани помежду си с поддръжка на Обама. На следващо място, по-скоро, отколкото изграждането на тежести на индивидуално равнище, както направихме в нашия пример, Wang и колеги използват комплексен модел за оценка на броя на хората във всяка група, които ще гласуват за Обама. И накрая, те се комбинира тези оценки на групата за подкрепа с известен размерът на всяка група да изготви прогнозираното общо ниво на подкрепа. С други думи, те нарязан на населението в различни групи, оценява подкрепата за Обама във всяка група, а след това взе претеглена средна стойност на оценките на групата, за да се получи цялостна оценка.

По този начин, голямото предизвикателство в техния подход е да се оцени подкрепата за Обама във всяка от тези 176,256 групи. Въпреки че тяхната панел включени 345,858 уникални участници, огромен брой по стандартите на предизборните проучвания, имаше много, много групи, за които Wang и колеги са имали почти никакви респонденти. Следователно, за да се оцени подкрепата във всяка група са използвали техника, наречена многостепенното регресия с пост-стратификация, която изследователите галено наричат г-н P. По същество, за да се оцени подкрепата за Обама в рамките на дадена група, г-н P. басейни информация от много тясно свързани групи. Например, помислете за предизвикателството на оценка на подкрепата за Обама сред жените, латиноамериканците, между 18-29 години, които са завършили колеж, които са регистрирани демократи, които се самоопределят като умерените, и които са гласували за Обама през 2008 г. Това е много, много специфична група, и че е възможно, че няма никой в пробата с тези характеристики. Следователно, за да се правят приблизителни оценки около тази група, г-н P. басейни заедно оценки от хората в много други подобни групи.

Използвайки тази стратегия анализ, Wang и колеги са били в състояние да използват XBox без вероятност проба, за да се прецени много внимателно цялостната подкрепа, че Обама получи в изборите 2012 г. (Фигура 3.5). В действителност техните оценки са по-точни от съвкупност от проучвания на общественото мнение. По този начин, в този случай, претеглянето-специално г-н P.-изглежда да свърши добра работа за коригиране на отклоненията в не-вероятност данни; пристрастия, които са видими, когато се вгледате в оценките от данните некоригирани Xbox.

Фигура 3.5: Оценките от Уанг и др. (2015 г.). Нерегулирани XBox проба произвежда неточни оценки. Но, претеглена XBox проба произведена оценки, които са по-точни от средно вероятностни-базирани телефонни проучвания.

Фигура 3.5: Оценките от Wang et al. (2015) . Нерегулирани XBox проба произвежда неточни оценки. Но, претеглена XBox проба произведена оценки, които са по-точни от средно вероятностни-базирани телефонни проучвания.

Има два основни поуки от проучването на Уанг и колеги. Първо, некоригирани проби не са вероятностите може да доведе до лоши оценки; Това е урок, че много изследователи са чували преди. Въпреки това, втората поука е, че не са случайни извадки, когато претеглените правилно, може действително да произвеждат доста добри оценки. В действителност, техните оценки са по-точни от оценките от pollster.com, съвкупност от по-традиционните предизборни анкети.

И накрая, има важни ограничения за това какво можем да научим от този един специфичен проучване. Просто защото след стратификация работи добре в този конкретен случай, няма гаранция, че ще работи добре и в други случаи. В действителност, изборите са може би един от най-лесните настройки защото социолозите са изучаване избори за почти 100 години, има редовна обратна връзка (можем да видим кой ще спечели изборите), и идентификационен страна и демографски характеристики са относително предсказуеми от гласуване. В този момент, ние не разполагат с твърд теория и емпиричните опит да се знае, когато с тегло корекции на неслучайни извадки, ще произвеждат достатъчно точни прогнози. Едно нещо, което е ясно, обаче, е, ако са принудени да работят с не-случайни извадки, а след това има силна причина да се смята, че коригираните оценки ще бъдат по-добри в сравнение с не-коригирани оценки.