3.4.2 Не-веројатност примероци: тежина

Со не-веројатност примероци, тегови може да го вратите нарушувања предизвикани од процесот на претпоставува земање мостри.

Во истиот начин на кој истражувачите тежина одговори од веројатност примероци, тие исто така може да одговори на тежината од не-веројатност примероци. На пример, како алтернатива на Стратегијата, замислете дека сте поставени банер реклами на илјадници веб-сајтови да се регрутирање на учесници за истражување да се процени стапката на невработеност. Се разбира, вие би се скептични дека едноставната средна вредност на вашиот примерок ќе биде добра проценка на стапката на невработеност. Вашиот скептицизам е веројатно затоа што мислите дека некои луѓе се со поголема веројатност да се заврши истражувањето вашиот од другите. На пример, луѓето кои не поминуваат многу време на интернет се со помала веројатност да ја заврши својата анкета.

Како што видовме во последниот дел, сепак, ако се знае како примерокот беше избран, како и со веројатност примероци, тогаш можеме да го вратите нарушувања предизвикани од процесот на земање примероци. За жал, кога се работи со не-веројатност примероци, ние не знаеме како беше избран примерок. Но, може да се направат претпоставки за процесот на земање примероци и потоа се применува пондер на ист начин. Ако овие претпоставки се точни, тогаш коефициентот ќе го вратите на нарушувања предизвикани од процесот на земање примероци.

На пример, замислете дека како одговор на вашиот банер реклами, регрутирани 100.000 испитаници. Сепак, не верувам дека овие 100.000 испитаниците се едноставни случајни примероци од возрасните Американци. Всушност, кога ќе се споредат испитаниците вашиот населението на САД, ќе најдете дека луѓето од некои држави (на пример, Њу Јорк) се повеќе застапени и дека луѓето од некои држави (на пример, Алјаска) не се доволно застапени. Така, стапката на невработеност на вашиот примерок е веројатно да биде лоша проценка на стапката на невработеност во целната популација.

Еден начин да го вратите на нарушување што се случи во процесот на земање примероци е да доделите тежина на секој човек; пониска тежина на луѓе од државите кои се повеќе застапени во примерокот (на пример, Њујорк) и поголема тежина на луѓе од државите кои се недоволно застапени во примерокот (на пример, Алјаска). Поконкретно, тежината на секој испитаник е поврзана со нивната распространетост во примерокот во однос на нивната распространетост во населението на САД. Оваа постапка тежина се нарекува пост-стратификација, а идејата на мерење треба да ве потсетам на пример во Дел 3.4.1 каде испитаниците од Род Ајленд беа дадени помалку тежина од испитаниците од Калифорнија. Пост-стратификација бара да се знае доволно за да се стави вашиот испитаниците во групи и да се знае процентот на целната популација во секоја група.

Иако коефициентот на примерок на веројатност и на примерокот на не-веројатност се исти математички (види технички слепото црево), тие добро работат во различни ситуации. Ако истражувачот има совршена по случаен (без грешка покриеност, а не не-одговор), тогаш коефициентот ќе произведува непристрасни проценки за сите својства во сите случаи. Оваа силна теоретска гаранција е зошто се залага на веројатност примероци ги најдат толку атрактивен. Од друга страна, коефициентот примероци не-веројатност ќе произведе само непристрасни проценки за сите карактеристики, ако склоности одговорот се исти за сите во секоја група. Со други зборови, Размислување назад кон нашиот пример, со користење на пост-стратификација ќе произведува непристрасни проценки, ако сите во Њујорк има иста веројатност да учествуваат и сите во Алјаска има иста веројатност за учество и така натаму. Оваа претпоставка се нарекува претпоставка хомогена-одговор-склоности-рок-групи, и тоа игра клучна улога во знаејќи дали пост-стратификација ќе работи и со не-веројатност примероци.

За жал, во нашиот пример, претпоставката хомогена-одговор-склоности-рок-групи се чини малку веројатно да биде вистина. Тоа е, се чини неверојатно дека сите во Алјаска има иста веројатност да биде во вашиот истражување. Но, постојат три важни поени да се има предвид за пост-стратификација, од кои сите го направите да изгледа повеќе ветувачки.

Прво, хомогена-одговор-склоности-рок-групи претпоставка станува веродостојно бројот на групи се зголемува. И, научниците не се ограничени на групите само врз основа на еден географски пазар. На пример, ние може да се создаде групи врз основа на државата, возраст, пол и ниво на образование. Се чини веројатно дека таму не се добие хомогена склоности одговор во рамките на групата од 18-29, дипломираните студенти од женски пол, колеџ живеат во Алјаска од редовите на групата на сите луѓе кои живеат во Алјаска. Така, како и бројот на групи кои се користат за пост-стратификација се зголемува, претпоставките потребни за поддршка на тоа да стане повеќе разумни. Со оглед на овој факт, ми се чини дека истражувачите ќе сакате да се создаде голем број на групи за пост-стратификација. Но, како и бројот на групи се зголемува, истражувачите наиде на поинаков проблем: sparsity податоци. Ако има само мал број на луѓе во секоја група, а потоа проценките ќе биде неизвесна, а во екстремни случаи кога постои група која нема испитаниците, а потоа пост-стратификација целосно се распаѓа. Постојат два начини за излез од оваа својствени тензија помеѓу однесувањето на homogeneous- претпоставка одговор-склоноста-рок-групи и побарувачката за разумна големина на примерокот во секоја група. Еден начин е да се преселат на повеќе софистицирани статистички модел за пресметување на тежини, а другата е да се соберат поголем, повеќе различни примерок, кој помага да се обезбеди разумна големина на примерокот во секоја група. И, понекогаш истражувачи работам и двете, како што јас ќе се опише во повеќе детали подолу.

Вториот предвид кога се работи со пост-стратификација од не-веројатност примероци е дека претпоставката хомогена-одговор-склоноста-рок-групи се веќе често се прави при анализата на веројатност примероци. Причината поради која е потребна оваа претпоставка за веројатност примероци во пракса е дека веројатноста примероци имаат не-одговор, и најчестиот метод за приспособување за не-одговорените е пост-стратификација, како што е опишано погоре. Се разбира, само затоа што многу истражувачи направи извесна претпоставка не значи дека треба да го прават тоа премногу. Но, тоа не значи дека кога се споредуваат не-веројатност примероци на веројатност примероци во пракса, ние мора да се има предвид дека и двете зависат од претпоставките и помошни информации, со цел да се произведе проценки. Во повеќето реални поставувања, едноставно, не постои претпоставка-слободен пристап до заклучок.

Конечно, ако се грижите за една проценка особено во нашиот пример невработеност стапка тогаш треба услов послаба од хомогена-одговор-склоноста-рок-групи претпоставка. Поточно, вие не треба да се претпостави дека секој има исто склоноста одговор, вие само треба да се претпостави дека не постои корелација помеѓу склоноста одговор и стапка на невработеност во рамките на секоја група. Се разбира, дури и оваа послаба состојба нема да се одржи во некои ситуации. На пример, замислете проценка на процентот на Американци кои го прават волонтерска работа. Ако луѓето кои го прават волонтерска работа се со поголема веројатност да се согласат да биде во една анкета, тогаш научниците ќе систематски над-се процени износот на волонтерската работа, дури и ако тие се направи корекција пост-стратификација, резултат кој е докажано емпириски со Abraham, Helms, and Presser (2009) .

Како што реков претходно, не-веројатност примероци се гледа со голем скептицизам од страна на научници од општествените науки, делумно поради нивната улога во некои од повеќето срамно неуспеси во раните денови на анкетно истражување. Јасен пример за тоа колку далеку сме одминале со не-веројатност примероци е истражување на Веи Ванг, Дејвид Ротшилд, Sharad Гоел и Андреј Gelman кој точно го обнови исходот од американските избори во 2012 година со користење на не-веројатност примерок од корисниците американски Xbox -А дефинитивно не е случаен примерок од Американците (Wang et al. 2015) . Истражувачите регрутирани испитаниците од системот на Xbox игри, и како може да се очекува, примерокот на Xbox изопачени машки и изопачени млади: 18 - 29 години возраст сочинуваат 19% од електоратот, но 65% од примерокот Xbox и мажите се направи до 47% од електоратот, а 93% од примерокот Xbox (Слика 3.4). Поради овие емигрираат предрасуди, необработени податоци Xbox беше лош показател за избори се враќа. Тој предвиде Убедлива победа на Мит Ромни во текот на Барак Обама. Повторно, ова е уште еден пример за опасностите од суровини, неприлагодени примероци не-веројатност и потсетува на фијаско книжевна билтени.

Слика 3.4: Демографија на испитаниците во Ванг et al. (2015 година). Бидејќи испитаниците беа регрутирани од XBox, тие се со поголема веројатност да се биде млад и со поголема веројатност да бидат мажи, во однос на избирачи во изборната 2012 година.

Слика 3.4: Демографија на испитаниците во Wang et al. (2015) . Бидејќи испитаниците беа регрутирани од XBox, тие се со поголема веројатност да се биде млад и со поголема веројатност да бидат мажи, во однос на избирачи во изборната 2012 година.

Сепак, Ванг и неговите колеги беа свесни за овие проблеми и се обидел да тежината на испитаниците да се поправи за процесот на земање примероци. Особено, тие се користат повеќе софистицирана форма на пост-стратификација ви кажував. Тоа е во вредност од учење малку повеќе за нивниот пристап, бидејќи таа го гради интуиција за пост-стратификација, а особено верзија Ванг и неговите колеги се користи е еден од највозбудливите пристапи за пондерирање примероци не-веројатност.

Во нашата едноставен пример за проценка на невработеност во Дел 3.4.1, ние поделени на населението во групи врз основа на состојбата на живеење. Спротивно на тоа, Ванг и неговите колеги се подели на населението во во 176.256 групи дефинирани од страна на: пол (2 категории), раса (4 категории), возраста (4 категории), Образование (4 категории), во државна (51 категории), партијата на проект (3 категории), идеологија (3 категории) и 2008 година гласање (3 категории). Со повеќе групи, истражувачите се надева дека тоа ќе биде поголема веројатност дека во рамките на секоја група, склоноста одговор беше неповрзани со поддршка за Обама. Следно, наместо изградба на индивидуални тежини ниво, како што направивме во нашиот пример, Ванг и неговите колеги се користи сложен модел да се процени бројот на луѓе во секоја група кои ќе гласаат за Обама. Конечно, тие ги комбинираат овие проценки група на поддршка со позната големината на секоја група за да се произведе проценета целокупното ниво на поддршка. Со други зборови, тие сецкани до населението во различни групи, проценува на поддршката за Обама во секоја група, а потоа зеде пондериран просек на оценки на групата за производство на целокупната проценка.

Така, голем предизвик во нивниот пристап е да се процени на поддршката за Обама во секоја од овие 176.256 групи. Иако нивната комисијата е вклучен и 345.858 уникатни учесници, голем број од стандардите на изборните анкети, имаше многу, многу групи за кои Ванг и колеги имаше речиси и да нема испитаниците. Затоа, за да се процени на поддршка во секоја група тие користат техника наречена многоетапна регресија со пост-стратификација, која истражувачите affectionately нарекуваат г-дин П. Во суштина, да се процени на поддршката за Обама во рамките на одредена група, г-дин П. базени информации од голем број тесно поврзани групи. На пример, сметаат дека предизвикот на проценување на поддршката за Обама меѓу женските, Хиспанците, помеѓу 18-29 години, кои се дипломирани, кои се регистрирани демократи, кои се идентификуваат како умерени, и што гласале за Обама во 2008 година е многу, многу специфична група, и тоа е можно дека не постои никој во примерокот со овие карактеристики. Затоа, да се направи проценки за оваа група, г-дин П. базени заедно проценува на луѓето од многу слични групи.

Користејќи се со оваа стратегија анализа, Ванг и неговите колеги беа во можност да го користите Xbox не-веројатност примерок за да се процени многу тесно целокупната поддршка што Обама доби на изборите во 2012 година (Слика 3.5). Всушност нивните проценки биле попрецизни од еден агрегат од истражувањето на јавното мислење. Така, во овој случај, тежина-конкретно г-дин П.-се чини дека се направи добра работа исправување на предрасуди во не-веројатност податоци; предрасуди кои се видливи кога ќе се погледне на проценките на податоци неусогласените Xbox.

Слика 3.5: Според проценките од Ванг et al. (2015 година). Нерегулиран XBox примерок произведени неточни проценки. Но, бројат XBox примерок произведува проценки кои се повеќе точно од просек на веројатност-базирани телефонски анкети.

Слика 3.5: Според проценките од Wang et al. (2015) . Нерегулиран XBox примерок произведени неточни проценки. Но, бројат XBox примерок произведува проценки кои се повеќе точно од просек на веројатност-базирани телефонски анкети.

Постојат две главни лекции од студијата на Ванг и колеги. Прво, неприлагодени примероци не-веројатност може да доведе до лоши проценки; ова е лекција дека многу истражувачи ги чуле. Но, втората лекција е дека не-веројатност примероци, кога бројат правилно, всушност може да се произведуваат доста добри проценки. Всушност, нивните проценки биле попрецизни во однос на проценките од pollster.com, агрегација на повеќе традиционални избирачки места.

Конечно, постојат важни ограничувања на она што можеме да научиме од оваа специфична студија. Само затоа што на пост-стратификација работено и во овој случај, не постои гаранција дека ќе работи и во други случаи. Всушност, изборите се можеби една од најлесните поставувања, бидејќи анкетарите ја проучуваат избори за речиси 100 години, има редовни повратни информации (можеме да видиме кој ќе победи на изборите) и идентификација на партијата и демографски карактеристики се релативно предвидливо на гласање. Во овој момент, ни недостасува солидна теорија и емпириски искуство за да знам кога тежина корекција на не-веројатност примероци ќе произведе доволно точни проценки. Едно нешто што е јасно дека, сепак, е ако се принудени да работат со не-веројатност примероци, тогаш постои силна причина да се верува дека приспособена проценки ќе биде подобар од не-приспособена проценки.