3.4.2 Qeyri-ehtimal nümunələri: ağırlığını

Bu tərcümə kompüter ilə yaradılmışdır. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 Qeyri-ehtimal nümunələri: ağırlığını

Qeyri-ehtimal nümunələri ilə çəkilər ehtimal seçmə prosesi səbəb təhrif geri ala bilərsiniz.

tədqiqatçılar ehtimal nümunələri cavab çəki Eyni şəkildə, onlar da qeyri-ehtimal nümunələri cavab çəki bilərsiniz. Məsələn, ÖTS alternativ olaraq, siz işsizlik dərəcəsi qiymətləndirmək üçün sorğu iştirakçıları işə web minlərlə banner reklam yerləşdirilmiş ki, təsəvvür. Təbii ki, siz nümunə sadə orta işsizlik nisbəti yaxşı smeta olacağını şübhə olacaq. Bəzi insanlar çox sorğu başa çatdırmaq üçün çox güman ki, hesab edirəm, çünki sizin skeptisizm yəqin ki. Məsələn, web çox vaxt sərf etməyin insanların sorğu başa çatdırmaq üçün az ehtimal olunur.

Biz son bölməsində gördüyümüz kimi, lakin biz bilirik nümunə seçilmiş kimi necə biz ehtimal ilə nümunələri-sonra biz seçmə prosesi səbəb təhrif geri ala bilərsiniz. qeyri-ehtimal nümunələri ilə iş zaman Təəssüf ki, biz nümunə seçildi necə bilmirəm. Lakin, biz nümunə prosesi haqqında fərziyyələr etmək və sonra eyni şəkildə ağırlığını müraciət edə bilər. Bu fərziyyələr doğru, onda ağırlığını seçmə prosesi səbəb təhrif geri olacaq.

Məsələn, banner reklam cavab, siz 100,000 respondent qəbul ki, təsəvvür. Lakin, bu 100,000 respondent Amerika böyüklər bir sadə təsadüfi nümunə var ki, inanmıram. Siz ABŞ əhalisinin üçün respondent müqayisə zaman Əslində, bəzi dövlətlərin (məsələn, New York) insanlar bəzi dövlətlərin (məsələn, Alaska) dən-dən çox təmsil və insanlar altında təmsil ki, tapa bilərsiniz. Belə ki, sizin nümunə işsizlik nisbəti əhalinin işsizlik nisbətinin pis smeta ola bilər.

seçmə prosesində baş verən təhrif geri üçün bir yol hər bir şəxs üçün çəkilər təyin edir; nümunə (məsələn, Alyaska) altında təmsil olunur dövlətlərin insanlara (məsələn, New York) nümunə və ali çəki artıq təmsil olunur dövlətlərin insanlara aşağı çəkilər. Daha konkret desək, hər cavabdeh çəki ABŞ əhalisinin öz yayılması üçün nümunə nisbətən onların yayılması ilə bağlıdır. Bu çəki prosedur post-təbəqələşmə adlanır və Rhode Island respondentlərin California respondentlərin az çəki verildi olduğu ağırlığında ideyası Bölmə 3.4.1 məsələn sizə xatırlatmaq lazımdır. Post-təbəqələşmə siz qrupa respondent qoymaq və hər bir qrup hədəf əhalinin nisbəti bilmək üçün kifayət qədər bilirik ki, tələb edir.

ehtimal nümunə və qeyri-ehtimal nümunə ağırlığını eyni riyazi (texniki Əlavə bax) olsa da, onlar müxtəlif vəziyyətlərdə yaxşı işləyir. tədqiqatçı mükəmməl ehtimalı nümunəsi (yəni, heç bir əhatə dairəsi səhv və qeyri-cavab) varsa, onda ağırlığını bütün hallarda bütün əlamətlərin üçün obyektiv hesablamalarına istehsal edəcək. ehtimal nümunələri müdafiə onlara cəlbedici tapmaq niyə bu güclü nəzəri təminatıdır. Digər tərəfdən, ağırlığını qeyri-ehtimal nümunələri cavab propensities hər bir qrup hər kəs üçün eynidir, əgər bütün əlamətlərin üçün obyektiv təxminidir istehsal edəcək. Başqa sözlə, Nyu-Yorkda hər kəs iştirak və Alyaska hər kəs belə iştirak eyni ehtimalı var eyni ehtimalı var obyektiv qiymətləndirmələr istehsal edəcək post-təbəqələşmə istifadə edərək, nümunə geri düşünür. Bu ehtimal homogen-cavab-propensities-ərzində-qruplar ehtimal adlanır və post-təbəqələşmə qeyri-ehtimal nümunələri ilə yaxşı işləyəcək, əgər bilmədən əsas rol oynayır.

Təəssüf ki, bizim misalda, homogen cavab-propensities-ərzində-qrupların ehtimal doğru olmaq çətin görünür. Yəni, bu, Alaska hər kəs üçün sorğu olan eyni ehtimalı var ki, çətin görünür. Lakin, daha perspektivli görünür etmək olan post-təbəqələşmə haqqında unutmayın üç mühüm xal var.

Birincisi, homogen cavab-propensities-ərzində-qrupların ehtimal qruplar artır sayı daha inandırıcı olur. Və tədqiqatçılar yalnız bir coğrafi ölçüsü əsasında qruplara məhdudlaşmır. Məsələn, biz dövlət, yaş, cins, və təhsil səviyyəsinə əsaslanır qrupları yarada bilər. Bu 18-29 qrupu çərçivəsində homogen cavab propensities olduğunu daha inandırıcı görünür, Alaska yaşayan bütün insanların qrupu çərçivəsində daha Alyaska yaşayan qadın, universitet məzunu. Belə ki, post-təbəqələşmə artır istifadə qruplarının sayı, ehtimallar daha ağlabatan olmaq dəstək lazımdır. Bu nəzərə alaraq, bu tədqiqatçılar post-təbəqələşmə üçün qruplar bir çox yaratmaq istəyirsiniz kimi görünür. data sparsity Lakin, qruplar artır sayı, tədqiqatçılar müxtəlif problem daxil. hər bir qrup insanların yalnız kiçik bir sıra var, onda hesablamaları daha qeyri-müəyyən ola bilər, və ekstremal halda heç bir respondent olan bir qrup olduğu, sonra post-təbəqələşmə tamamilə aşağı pozur. homogeneous- cavab-meyl-ərzində-qrupların ehtimal plausibility və hər bir qrup münasib nümunə ölçüləri üçün tələb arasında bu xas gərginlik həyata iki yolu var. One yanaşma çəkilər hesablanması üçün daha inkişaf etmiş statistik model hərəkət və digər hər qrup ağlabatan nümunə ölçüləri təmin edir daha böyük, daha müxtəlif nümunə, toplamaq üçün edir. Mən aşağıda daha ətraflı təsvir lazımdır kimi, bəzən tədqiqatçılar, həm də yoxdur.

qeyri-ehtimal nümunələri post-təbəqələşmə ilə iş ikinci baxılması ehtimalı nümunələri təhlil edərkən homogen-cavab-meyl-ərzində-qrupların ehtimal artıq tez-tez edilir ki. bu fərziyyə praktikada ehtimalı nümunələri üçün lazım olan səbəb ehtimal nümunələri qeyri-cavab var, və yuxarıda təsvir kimi qeyri-cavab tənzimləmək üçün ən ümumi metod post-təbəqələşmə var. Əlbəttə, bir çox tədqiqatçılar müəyyən ehtimal çox bunu etməlidir ki, demək deyil etmək yalnız çünki. Lakin, təcrübədə ehtimalı nümunələri qeyri-ehtimal nümunələri müqayisə zaman, biz də təxminlər çıxarmaq məqsədiylə fərziyyələr və köməkçi məlumatlar asılı unutmayın lazımdır ki, deməkdir. ən real parametrləri, sadəcə müdaxilə üçün heç bir ehtimal pulsuz yanaşma var.

Siz bizim misal işsizlik xüsusilə-in haqqında bir təxmin qayğı əgər Nəhayət, dərəcəsi sonra homogen-cavab-meyl-ərzində-qruplar ehtimal daha zəif bir şərt lazımdır. Xüsusilə, siz yalnız hər qrup daxilində cavab meyl və işsizlik nisbəti arasında heç bir bağlılıq yoxdur güman lazımdır hər kəs eyni cavab meyl var ki, güman etmək lazım deyil. Əlbəttə ki, hətta bu zəif vəziyyətdə bəzi hallarda keçirilməsi deyil. Məsələn, könüllü iş amerikalıların nisbəti qiymətləndirilməsi düşünün. Könüllü iş adamın sorğu olmaq razı daha çox, onda tədqiqatçılar olacaq sistematik over-qiymətləndirmək onlar tərəfindən empirically nümayiş edilmişdir ki, bir nəticə post-təbəqələşmə düzəlişlər etmək olsa da, könüllü məbləği Abraham, Helms, and Presser (2009) .

Mən əvvəllər dediyi kimi, qeyri-ehtimal nümunələri, çünki sorğu tədqiqat erkən gün ən utanc verici uğursuzluqlar bəzi onların rolu hissəsi, sosial elm adamları tərəfindən böyük skeptisizm ilə baxılır. qeyri-ehtimal nümunələri ilə gəlmişəm nə qədər aydın nümunəsidir düzgün American Xbox istifadəçilərinin qeyri-ehtimal nümunə istifadə edərək 2012 seçki nəticəsini bərpa Wei Wang, David Rothschild, Sharad Goel, və Andrew Gelman tədqiqat edir amerikalıların -a cəsarətlə qeyri-təsadüfi nümunə (Wang et al. 2015) . Tədqiqatçılar XBox oyun sistemi respondent cəlb, və siz gözləyə bilər kimi, Xbox nümunə kişi əyri və gənc əyri: 18 - 29 yaşlı seçicilərin 19% lakin Xbox nümunə 65% təşkil edir və men 47% təşkil edir seçicilərin və Xbox nümunə (Şəkil 3.4) 93% -i. Çünki bu güclü demoqrafik fikirlərinə ki, xam Xbox data seçkilərin yekunları bir yoxsul göstəricisi idi. Bu Barak Obama artıq Mitt Romney üçün güclü qələbə proqnozlaşdırılır. Yenə bu xam, nizamlanmamış qeyri-ehtimal nümunələri təhlükələr bir nümunəsidir və ədəbi Digest fiyasko xatırladır.

Şəkil 3.4: Wang et al respondentlərin Demoqrafik. (2015). Respondentlərin XBox cəlb Çünki, onlar gənc və 2012 seçkilərində seçicilərin nisbətən kişi olmaq daha çox ola daha çox idi.

Şəkil 3.4: respondentlərin Demoqrafik Wang et al. (2015) . Respondentlərin XBox cəlb Çünki, onlar gənc və 2012 seçkilərində seçicilərin nisbətən kişi olmaq daha çox ola daha çox idi.

Lakin, Wang və həmkarları bu problemlərin xəbərdar idi və seçmə prosesi üçün düzəltmək üçün respondent çəki cəhd. Xüsusilə, onlar haqqında məlumat verib post-təbəqələşmə daha mürəkkəb forması istifadə olunur. Bu post-təbəqələşmə haqqında intuisiya qurur, çünki onların yanaşma haqqında bir az daha çox öyrənmək lazımdır, və istifadə versiya Wang və həmkarları ağırlığını qeyri-ehtimal nümunələri ən maraqlı yanaşmalar biridir.

Bölmə 3.4.1-ci ildə işsizliyin qiymətləndirilməsi haqqında sadə misal olaraq, biz yaşayış dövlət əsasında qrupa əhalisi bölünür. Əksinə, Wang və həmkarları tərəfindən müəyyən 176.256 qrupa əhalisi bölünür: gender (2 kateqoriyalar), irqi (4 kateqoriyalar), yaş (4 kateqoriyalar), təhsil (4 kateqoriyalar) dövlət (51 kateqoriyalar), party ID (3 kateqoriyalar), ideologiya (3 kateqoriyalar) və 2008-ci səs (3 kateqoriyalar). daha çox qruplar ilə, tədqiqatçılar hər qrup daxilində, cavab meyl Obama dəstəyi ilə surətdə idi ki, getdikcə daha çox olardı ki, ümid. Next deyil, biz nümunə kimi, fərdi səviyyədə çəkilər tikintisi daha Wang və həmkarları Obama səs verəcəyini Hər bir qrup insanların nisbəti hesablamaq üçün kompleks model istifadə. Nəhayət, onlar dəstək təxminən ümumi səviyyədə istehsal hər bir qrup tanınmış ölçüsü dəstək bu qrup hesablamalarına birlikdə. Başqa sözlə, onlar müxtəlif qrupa əhalisi qədər doğranıb hər bir qrup Obama dəstək təxmin və sonra ümumi smeta istehsal qrup hesablamalarına bir orta ölçülmüş etdi.

Belə ki, öz yanaşma böyük problem bu 176.256 qrupların hər Obama dəstək qiymətləndirmək üçün. Onların panel 345.858 unikal iştirakçıları seçki seçki standartları ilə bir çox daxil olsa da, Wang və həmkarları demək olar ki, respondent olan üçün çox qruplar var idi. Buna görə də, tədqiqatçılar affectionately çox olan cənab P. hovuz məlumat müəyyən bir qrup ərzində Obama dəstək qiymətləndirmək, mahiyyətcə cənab P. zəng post-təbəqələşmə ilə çoxsəviyyəli reqressiya adlı bir texnika istifadə hər bir qrup, dəstək qiymətləndirmək üçün yaxından qruplar bağlı. Məsələn, kim mülayim özünü müəyyən demokratlar qeydə alınır universitet məzunu, və bu 2008-ci ildə Obama üçün səs verən, 18-29 yaş arasında, qadın Hispanics arasında Obamaya dəstək qiymətləndirilməsi problem hesab bir çox, çox xüsusi qrup və bu xüsusiyyətləri ilə nümunə heç kim yoxdur ki, mümkün deyil. Buna görə də, bu qrup haqqında təxminlər etmək, cənab P. hovuz birlikdə çox oxşar qruplar insanların qiymətləndirir.

Bu analiz strategiya istifadə edərək, Wang və həmkarları (Şəkil 3.5) çox yaxından Obama 2012-ci il seçkilərində alınan ümumi dəstək qiymətləndirmək üçün XBox qeyri-ehtimal nümunə istifadə edə bildik. Əslində onların hesablamalarına ictimai rəy sorğusunun bir ümumi daha dəqiq idi. Belə ki, bu halda, ağırlığını-xüsusi Mr. qeyri-ehtimal data meyli korrektə yaxşı bir iş etmək P.-görünür; Siz nizamlanmamış Xbox məlumatlar hesablamalarına baxdığımız zaman görünür biases.

Şəkil 3.5: Wang et al alınan təxminlərə. (2015). Nizamlanmamış XBox nümunə qeyri-dəqiq hesablamalarına istehsal. Amma ölçülmüş XBox nümunə ehtimal əsasında telefon sorğular orta daha dəqiq idi hesablamalarına istehsal.

Şəkil 3.5: alınan təxminlərə Wang et al. (2015) . Nizamlanmamış XBox nümunə qeyri-dəqiq hesablamalarına istehsal. Amma ölçülmüş XBox nümunə ehtimal əsasında telefon sorğular orta daha dəqiq idi hesablamalarına istehsal.

Wang və həmkarları iş iki əsas dərslər var. Birincisi, nizamlanmamış qeyri-ehtimal nümunələri pis hesablamalara gətirib çıxara bilər; Bu çox tədqiqatçılar əvvəl eşitmişəm ki, bir ibrət vardır. Lakin, ikinci dərs düzgün ölçülmüş zaman qeyri-ehtimal nümunələri, həqiqətən, çox yaxşı təxminlər istehsal edə bilər ki. Əslində, onların hesablamalarına pollster.com, daha ənənəvi seçki sandıq bir toplama alınan təxminlərə daha dəqiq idi.

Nəhayət, biz bu müəyyən bir iş əldə edə bilərsiniz nə üçün vacibdir məhdudiyyətlər var. post-təbəqələşmə bu halda yaxşı işləyib Məhz, digər hallarda yaxşı işləyəcək ki, heç bir təminat yoxdur. pollsters demək olar ki, 100 il seçkiləri təhsil edilmişdir, çünki Əslində, seçkilər bəlkə asan ayarları biridir, orada müntəzəm rəy (biz seçkiləri qazanan bilərsiniz), və əyləncə gecələri şəxsiyyət və demoqrafik xüsusiyyətləri səsvermə nisbətən sadələşdirilmiş var. Bu nöqtədə, biz möhkəm nəzəriyyəsi və qeyri-ehtimal nümunələri çəkisi düzəlişlər kifayət qədər dəqiq hesablamaları istehsal edəcək zaman bilmək empirik təcrübə yoxdur. Əgər qeyri-ehtimal nümunələri ilə işləməyə məcbur əgər aydındır bir şey, lakin, sonra düzəliş təxminlər qeyri-düzəliş hesablamalarına daha yaxşı olacağına inanıram güclü bir səbəb yoxdur.