математикалык белгилер

ушул толуктоонун, мен бир аз көбүрөөк математикалык түрүндө бөлүмүндөгү ой-айрым айтып берет. Бул жерде максат Эгер ушул маселелер боюнча жазуу жүзүндөгү көбүрөөк техникалык материалды өтүүгө болот деп изилдөө изилдөөчүлөр тарабынан пайдаланылуучу белгилер жана математикалык алкагында эркин алууга жардам берүү болуп саналат. Мен ыктымалдык пробаларды киргизүү менен башталат, андан кийин зулумдуктарына менен күтүүсүз тандоо көчүп, акыры эмес ыктымалдуулук тандап алуу.

Probability үлгүлөрдү алуу

бир чуркап Мисалы, Кошмо Штаттарда жумушсуздук катнашы аныктоо максатын карап көрөлү. Болсун \(U = \{1, \ldots, k, \ldots, N\}\) максаттуу калк менен болсун \(y_k\) адам жыйынтыгы өзгөрмөнүн наркы боюнча \(k\) . Бул мисалда \(y_k\) адам жокпу \(k\) жумушсуз. Акыр-аягы, жол \(F = \{1, \ldots, k, \ldots, N\}\) жөнөкөйлүүлүгү үчүн максаттуу калк менен бирдей болушу болжолдонууда кадр калк болот.

Негизги ылгап алмаштырылбайт жөнөкөй кокусунан тандап алуу болуп саналат. Бул учурда ар бир адам тандап киргизүү үчүн бирдей мүмкүн \(s = \{1, \ldots, i, \ldots, n\}\) . маалыматтар тандап алуу дизайны менен алынат, бир изилдөөчүлөр үлгү менен ортончу калктын жумушсуздук баа берет:

\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]

кайда \(\bar{y}\) калктын жумушсуздук жана \(\hat{\bar{y}}\) жумушсуздуктун баа болуп саналат ( \(\hat{ }\) адатта болот бир багалаушы көрсөтүү үчүн колдонулат).

Чынында, окумуштуулар сейрек алмаштырылбайт жөнөкөй кокустук пробаларды колдонушат. себептер менен (алардын бири мен бир заматта сүрөттөп аласыз) ар түрдүү, адистердин айтымында, көп учурда киргизүү бирдей эмес ыктымалдуулук менен үлгүлөрүн жараткан. Мисалы, изилдөөчүлөр California адамдарга караганда киргизүү жогорку ыктымалдуулук менен иши тандоо мүмкүн. Бул учурда, үлгү билдирет (.ж. 3.1) жакшы Алгоритмдин эмес болушу мүмкүн. киргизүү бирдей ыктымалдыгы бар, тескерисинче,, изилдөөчүлөр пайдаланууга

\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]

кайда \(\hat{\bar{y}}\) жумушсуздуктун жана баа \(\pi_i\) адам \(i\) .Ал киргизүү ыктымалдуулугу. стандарттык эрежелерге ылайык, мен Лачынского менен багалаушы чалам. 3.2 Horvitz-Томпсон Алгоритмдин. Ар кандай ыктымалдык үлгүлөрдү иштеп чыгуу үчүн калыс баа алып келет, анткени Horvitz-Томпсон Алгоритмдин өтө пайдалуу (Horvitz and Thompson 1952) . Horvitz-Томпсон Алгоритмдин абдан көп чыгат, анткени, ал ошол байкабай пайдалуу болуп кайра жазылышы мүмкүн

\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]

кайда \(w_i = 1 / \pi_i\) . Лачынского катары. 3.3, Horvitz-Томпсон Алгоритмдин салмактанып үлгү тараза тескери тандап алуу ыктымалдыгы менен байланышкан жерде эмнени байкайбыз. Башкача айтканда, аз адам, сыягы, үлгү, адам сметада керек көбүрөөк салмагы киргизилиши керек.

Жогоруда айтылып кеткендей, изилдөөчүлөр көбүнчө киргизүү бирдей эмес ыктымалдуулук менен татып. Киргизүү бирдей эмес ыктымалдуулук алып келиши мүмкүн үлгүсүнүн бир мисалы тыгыз пост-катмарлашуусу деп эсептөө тартиби менен байланышкан, анткени түшүнүү маанилүү търънд тандап алуу болуп саналат. Търънд тандоо, илимий салып максаттуу калктын бөлүнүшү \(H\) өз ара өзгөчө жана толук топтор. Бул топтор катмары деп аталат, ошондой эле көрсөтүлгөн \(U_1, \ldots, U_h, \ldots, U_H\) . Бул мисалда, катмары мамлекеттер болуп саналат. Топтордун өлчөмү катары көрсөтүлгөн \(N_1, \ldots, N_h, \ldots, N_H\) . Бир изилдөөчү ал жумушсуздук мамлекеттик даражадагы баалоо үчүн ар бир мамлекет жетиштүү адамдарды бар экенин текшерүү үчүн търънд тандоону колдонуу керек болушу мүмкүн.

Катмарын бөлүнүп кийин, изилдөөчү көлөмү алмаштырылбайт жөнөкөй кокустук үлгүсүн тандайт деп ойлойбуз \(n_h\) , өз алдынча ар бир катмардын өкүлү болгон. Андан тышкары, үлгүсүндөгү тандалган ар бир жоопкер болуп калат деп ойлойбуз (I кийинки бөлүмгө эмес жооп чече аласыз). Бул учурда, киргизүү ыктымалдуулугу бар

\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]

Бул ыктымалдыгы адамдан адамга ар кандай болушу мүмкүн, анткени, бул үлгүлөрдү дизайн таразалайт кийин, изилдөөчүлөр Horvitz-Томпсон багалаушы (.ж. 3.2) колдонуу менен киргизүү, алардын ыктымалдыгы кайтарым менен ар-бир респондентке салмактын керек.

Horvitz-Томпсон Алгоритмдин калыс болсо да, окумуштуулар кошумча маалымат менен үлгүдөгү бириктирип, тагыраак (башкача айтканда, төмөнкү дисперсиясы) сметасын өндүрө алат. Кээ бир адамдар бул кемчиликсиз ишке ыктымалдык үлгүлөрдү бар да чындык бул калыштуу экенин байкадым. Бул кийин көрсөтөм деп ыкмалары кошумча маалыматты пайдалануу, анткени абдан маанилүү, кошумча маалымат зулумдуктарына менен ыктымалдык үлгүнүн жана азык-ыктымалдыгы үлгүнүн баа берүүлөрүн эске алуу абдан маанилүү болуп саналат.

Көмөкчү маалыматты пайдалануу үчүн бир жалпы ыкмасы пост-.Катмарлар. изилдөөчүсү 50 мамлекеттердин ар биринде эркектер менен аялдардын санын билет, мисалы, элестетип; Биз сыяктуу эле, бул топ өлчөмдөрүн билдирет \(N_1, N_2, \ldots, N_{100}\) . Камтуу менен, бул кошумча маалыматты биригип, илимий салып үлгүсүн бөлүүгө болот \(H\) топтор (бул учурда 100-жылы), ар бир топ боюнча баа кылып, андан кийин бул топ салмактанып алынган орточо түзүү дегенди билдирет:

\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]

Болжол менен, Лачынского менен Алгоритмдин. 3.5 Ал белгилүү калктын маалымат-колдонот, анткени так болушу мүмкүн \(N_h\) көз караш тандоо керек болот, эгерде туура баалоо критерийлерине. Бул тууралуу ойлонуп бир жолу маалымат буга чейин чогултулган кийин пост-катмарлашуусу катмарлашууну жакындоосун сыяктуу болот.

бирдей эмес ыктымалдуулук менен тандап, жана търънд тандоо туш келди ылгап алуу ордуна туруп: Жыйынтыктап айтканда, бул бөлүмдө бир нече тандап алуу долбоорлорду айтып берди. Ошондой эле, баа эки негизги ойлорду айтып берди: Horvitz-Томпсон багалаушы жана пост-катмарларга. Ыктымалдуулук үлгүлөрдү үлгүлөрүнүн бир дагы расмий аныктоо үчүн, 2-бөлүмүн карагыла Särndal, Swensson, and Wretman (2003) . Търънд тандоо бир дагы расмий жана толук дарылоо үчүн, 3,7 бөлүмүн карагыла Särndal, Swensson, and Wretman (2003) . Horvitz-Томпсон багалаушы өзгөчөлүктөрүнүн техникалык баяндоо үчүн, кара Horvitz and Thompson (1952) , Overton and Stehman (1995) , же @ sarndal_model_2003 2,8 көрүү. Пост-катмарларга көбүрөөк расмий дарылоо үчүн, кара Holt and Smith (1979) , Smith (1991) , Little (1993) , же 7,6 көрүү Särndal, Swensson, and Wretman (2003) .

Зулумдуктарына менен Probability үлгүлөрдү алуу

Дээрлик бардык чыныгы изилдөөлөр зулумдуктарына бар; башкача айтканда, үлгү калктын ар бир адам эмес, ар бир суроого жооп берет. Зулумдуктарына эки негизги түрү бар: пункт зулумдуктарына жана бирдиги зулумдуктарына. пункт зулумдуктарына, кээ бир респонденттер айрым ден жооп эмес, (мисалы, айрым респонденттер кылдат карап суроолорго жооп бергибиз келбейт да). бирдиги зулумдуктарына, тандоо калк үчүн тандалып алынган кээ бир адамдар ар кандай сурамжылоого жооп жок. бирдиги зулумдуктарына эки көп таралган себептери сурамжылоого адам менен байланышып, үлгү адам кайрылган, бирок катышуудан баш тарткан учурда мүмкүн эмес деп жатышат. Бул бөлүмдө, мен бирдиги зулумдуктарына багытталат; пункт зулумдуктарына кызыккан окурмандар аз Эстудиантес көрүшү керек (2002) .

Изилдөөчүлөр көп бирдиги эмес жооп эки баскычтуу тандап алуу жараяны менен жүргүзүлгөн сурамжылоонун жөнүндө ойлонуп көр. Биринчи этапта, изилдөөчү үлгүсүн тандайт \(s\) ар бир адам киргизүү бир ыктымалдыкка ээ, мисалы, \(\pi_i\) (эгерде \(0 < \pi_i \leq 1\) ). Андан кийин, экинчи этабында, ыктымалдуулук менен үлгү жооп алып, тандалган адамдар \(\phi_i\) (эгерде \(0 < \phi_i \leq 1\) ). Респонденттердин акыркы жыйындысы Бул эки баскычтуу жараяны натыйжалары \(r\) . Бул эки этапта ортосунда маанилүү айырмачылыктар изилдөөчүлөр үлгүсүн тандоо жараянын башкаруу, бирок респонденттер болуп калган Сурамжылоого алынгандардын кайсы көзөмөлдөө эмес. бул эки жараяндарды коюу, кимдир бирөө жоопкер болот деп ыктымалдыгы

\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]

жөнөкөйлүк үчүн, мен баштапкы үлгү дизайн алмаштырылбайт жөнөкөй кокусунан тандап алуу болуп саналат, анда ишти карап баштайт. Изилдөөчүсү көлөмү үлгүсүн тандайт болсо \(n_s\) берет \(n_r\) респонденттерди жана изилдөөчү эмес жооп четке каккан жана респонденттердин каражатты колдонуп болсо, анда баа бир тараптуулугу болот:

\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]

кайда \(cor(\phi, y)\) жооп жөндөмдөрүнө ортосунда калктын өз ара байланыш жана жыйынтыгы (мисалы, жумушсуздук абалы), \(S(y)\) жыйынтыгы боюнча калктын стандарттык четтөө (мисалы, жумушсуздук Статусунда), \(S(\phi)\) жооп жөндөмдөрүнө калкы стандарттык четтөө жана \(\bar{\phi}\) калктын жооп зээндүү дегеним (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .

Eq. 3.7 зулумдуктарына төмөндөгүдөй шарттардын бири аткарылса, анда жан киргизүү мүмкүн эмес экенин көрсөтүп турат:

  • Жумушсуздук абалы боюнча эч кандай өзгөрүү жок \((S(y) = 0)\) .
  • Жооп Ыйыктыктын эч кандай өзгөрүү жок \((S(\phi) = 0)\) .
  • Жооп жөндөмдөрүнө жана жумушсуздук статусу ортосунда эч кандай байланыш жок \((cor(\phi, y) = 0)\) .

Тилекке каршы, бул шарттардын эч мүмкүн эместей. Бул иш менен камсыз кылуу абалы эч кандай өзгөрүү болбойт деп же жооп Ыйыктыктын эч кандай өзгөрүү болбойт деген болбойт көрүнөт. Ошентип, Лачынского негизги термин. 3.7 байланыш: \(cor(\phi, y)\) . Мисалы, адамдар жумушсуз ким жооп көбүрөөк, анда эсептик жумуш менен эркек аттууларынын бирин жан керек болсо.

зулумдуктарына бар болсо, баа берүүлөрүн эске алуу менен куулук көмөкчү маалыматтарды колдонуу болуп саналат. Мисалы, кошумча маалыматтарды колдонсо боло турган бир жолу кийинки курчуду (чакыртып алуу .ж. жогорудан 3.5) болуп саналат. Бул пост-катмарлашуусу багалаушы чаташтырууга экенин көрдүк:

\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]

кайда \(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) , жана \(\bar{\phi}^{(h)}\) жогоруда катары аныкталат, бирок топ адамдар менен чектелген \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) . Ошентип, жалпы тараптуулугу ар бир пост-катмарлашуусу топто катасын аз болсо аз болот. Мен ар бир пост-катмарлашуусу тобу чакан логикасыздыкты кабыл алуу жөнүндө ойлонуп көрөм, эки жолу бар. Биринчиден, сиз жооп өөрчүшүнө карата ар бир тектүү тобун аз айырмачылыктар бар жерде түзүүгө аракет келет ( \(S(\phi)^{(h)} \approx 0\) ) жана жыйынтыгы ( \(S(y)^{(h)} \approx 0\) ). Экинчиден, сиз көрө эл көрө албаган адамдар сыяктуу кайда топторду түзүүгө келет ( \(cor(\phi, y)^{(h)} \approx 0\) ). EQ салыштыруу. 3.7 .ж. 3.8 пост-катмарлашуусу зулумдуктарына улам бир жактуу кыскартууга болот чечмелөөгө жардам берет.

Жыйынтыктап айтканда, бул бөлүм зулумдуктарына менен күтүүсүз тандоо үчүн үлгү калтырган жана зулумдуктарына жана пост-катмарлашуусу өзгөртүүлөр менен да киргизүүгө болот жагын көрсөттү. Bethlehem (1988) жалпы үлгүлөрдү үлгүлөрүнө зулумдуктарына менен шартталган көз-караш бир туундусу сунуш кылат. Зулумдуктарына тууралуу үчүн кийинки катмарлашууну колдонуу тууралуу көбүрөөк көрүп Smith (1991) жана Gelman and Carlin (2002) . Post-катмарлашуусу калибрлөө estimators деп аталган ыкмалар кыйла жалпы үй-бүлөсүнүн бир бөлүгү болуп саналат, Чжан карагыла (2000) макала-узундугу жана дарылоо үчүн Särndal and Lundström (2005) деген китеп узундугу дарылоо. Зулумдуктарына үчүн эске алуу үчүн башка салмак ыкмалары тууралуу көбүрөөк көрүп Kalton and Flores-Cervantes (2003) , Brick (2013) , жана Särndal and Lundström (2005) .

Келишимдик ыктымалдык үлгүлөрдү алуу

Келишимдик ыктымалдуулук үлгүлөрдү үлгүлөрүн көп түрдүү камтыйт (Baker et al. 2013) . Wang жана кесиптештер менен Xbox пайдалануучулардын үлгү боюнча атайын токтолуп (W. Wang et al. 2015) , Сен тандап алуу дизайны жөнүндө эмес, негизги бөлүгү кайсы бир үлгүдөгү ушундай ойлоого болот \(\pi_i\) ( киргизүү боюнча илимий-кууп ыктымалдыгы), ал эми \(\phi_i\) (респондент-кууп жооп Ыйыктыктын). Албетте, бул идеалдуу эмес, анткени \(\phi_i\) белгисиз. Бирок, Кытай жана кесиптештери көрсөтүп тургандай, изилдөөчү жакшы көмөкчү маалыматтарды жана бул көйгөйлөрдү үчүн жоопко жакшы статистикалык үлгү бар болсо, өтө камтуу ката муктаж баш-жылы үлгү-да алуунун чейин мындай оор болушу мүмкүн эмес.

Bethlehem (2010) зулумдуктарына жана камтуунун каталарды да камтыйт пост-катмарларга жөнүндө жогоруда тили көп камтыйт. Пост-катмарларга тышкары, камтуу каталар жана зулумдуктарына-камтыйт үлгү дал келүүсү менен эмес ыктымалдык үлгүлөр жана ыктымалдык үлгүлөрүн менен иштөө боюнча башка ыкмалар (Ansolabehere and Rivers 2013; ??? ) , зээндүү эсеби салмак (Lee 2006; Schonlau et al. 2009) жана калибрлөө (Lee and Valliant 2009) . Бул ыкмалар арасында бири жалпы тема көмөкчү маалыматты пайдалануу болуп эсептелет.