Fanamarihana matematika

Amin'ity appendice ity, dia hamaritra sasantsasany amin'ireo hevitra avy ao amin'ny toko amin'ny endrika matematika aho. Ny tanjona eto dia ny hanampy anao hahazo aina amin'ny fandinihana sy ny matematika ampiasaina amin'ny mpikaroka mpikaroka mba hahafahanao mandroso mankany amin'ny fitaovana ara-teknika hafa voasoratra etsy ambony. Hanomboka amin'ny fampidirana ny fakan-tahiry azo tsapain-tanana, avy eo dia mandroso mankany amin'ny fahombiazan'ny famandrihana amin'ny tsy famerenana, ary amin'ny farany, ny tsy fahombiazan'ny famandrihana.

Probabilitie probabilité

Ho ohatra ohatra, andeha hojerentsika ny tanjon'ny fanombanana ny tahan'ny tsy fananana asa any Etazonia. Aoka ny \(U = \{1, \ldots, k, \ldots, N\}\) no lasibatra be indrindra ary avelao \(y_k\) ny lanjan'ny variables ho an'ny olona \(k\) . Ao amin'io ohatra io \(y_k\) dia misy olona \(k\) tsy an'asa. Farany, avelao ny \(F = \{1, \ldots, k, \ldots, N\}\)

Ny famolavolana fototarazo fototra dia tsipika samihafa samihafa tsy misy fanoloana. Amin'io tranga io, ny olona tsirairay dia azo ampidinina amin'ny sombin-javatra \(s = \{1, \ldots, i, \ldots, n\}\) . Rehefa voangona miaraka amin'ny endriky ny famolavolana ny angon-drakitra, ny mpikaroka iray dia afaka manombatombana ny tahan'ny tsy fananan'asa amin'ny olona miaraka amin'ny ohatra:

\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]

izay \(\bar{y}\) dia ny tahan'ny tsy fananana asa eo amin'ny mponina sy ny \(\hat{\bar{y}}\) dia ny tombantombana ny tahan'ny tsy fananana asa (ny \(\hat{ }\) dia Matetika nampiasaina hanondroana mpandinika).

Raha ny tena marina, dia matetika no tsy mampiasa ny fakan-tsarimihetsika tsotra fotsiny ny mpikaroka raha tsy misy ny fanoloana. Noho ny antony maro samihafa (ny iray amin'izany no horesahako ato anatin'ny fotoana fohy), matetika ny mpikaroka dia mamorona karazam-pahaizana mitovitovy. Ohatra, ireo mpikaroka dia mety hifidy olona any Florida miaraka amin'ny fampidiran-dàlana ambony kokoa noho ireo olona any California. Amin'ity tranga ity, ny dikany dia midika hoe (3.1) dia mety tsy ho mpandinika tsara. Raha toa kosa ka misy tanjona tsy azo lavina amin'ny fampidiran-dresaka, dia mampiasa ny mpikaroka

\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]

Ny toerana \(\hat{\bar{y}}\) dia tombanana amin'ny tahan'ny tsy fananan'asa ary \(\pi_i\) dia olona \(i\) 'ny mety ho fampidirana. Aorian'ny fanao mahazatra, hiantso ny mpandinika aho amin'ny eq. 3.2 ny mpandinika Horvitz-Thompson. Ny mpikaroka Horvitz-Thompson dia tena ilaina tokoa satria mitarika ho amin'ny tombana tsy misy fitoviana amin'ny mety ho fametrahana ny famolavolana drafitra (Horvitz and Thompson 1952) . Satria ny mpandinika Horvitz-Thompson dia matetika miakatra, mahasoa ny mahamarika fa azo averina indray amin'ny

\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]

aiza \(w_i = 1 / \pi_i\) . As eq. 3.3 dia manambara, ny mpandinika Horvitz-Thompson dia lasibatra be dia be midika hoe aiza no misy ifandraisany amin'ny lanjan'ny fifantenana ny lanja. Raha lazaina amin'ny teny hafa, ny tsy dia mahasarika olona iray dia tokony hampidirina ao amin'ilay santionany, ny lanjany tokony ho raisin'ilay olona.

Araka ny voalaza tetsy aloha, dia matetika ny mpikaroka no mahita olona tsy manana ny toerany. Ohatra iray ny famolavolana izay afaka mitarika ho amin'ny tsy mitovy probabilities ny fampidirana dia stratified santionany, izay zava-dehibe ny mahatakatra satria Mifandray akaiky ny tombany paika atao hoe post-stratification. Ao amin'ny fametrahana fitiliana, ny mpikaroka iray dia manasaraka ny vondron'olona kinendry ao amin'ny \(H\) vondrona miavaka sy mavitrika. Ireo vondrona ireo dia antsoina hoe strata ary voatondro ho \(U_1, \ldots, U_h, \ldots, U_H\) . Amin'ity ohatra ity, ny fitaratra dia milaza. Ny haben'ny vondrona dia aseho ho \(N_1, \ldots, N_h, \ldots, N_H\) . Ny mpikaroka iray dia mety te-hampiasa fitetezam-paritra voafaritra mba hahazoana antoka fa manana olona ampy isaky ny fanjakana izy mba hahazoana tombombarotra momba ny tsy fisian'ny asa.

Raha vao navela ho any strata ny mponina, dia \(n_h\) fa ny mpikaroka dia mifidy santionan-javatra tsotra iray tsy misy fanoloana ny habeny \(n_h\) , tsy miankina tsirairay avy amin'ny strata. Ankoatra izany, mihevera fa ny olona rehetra voafantina ao amin'ny santionany dia lasa mpanohitra (hizara ny tsy fandraisana andraikitra amin'ny fizarana manaraka). Amin'ity tranga ity, ny mety hisian'ny fampidirana

\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]

Noho ireo tombontsoa ireo dia mety tsy mitovy amin'ny olona amin'ny olona, ​​raha mahatsapa ny tombantombana amin'ity famolavolana famintinana ity, mila mandanjalanja ireo mpanohana tsirairay ny mpikaroka amin'ny alàlan'ny fanodinana ny mety hitrangan'izany amin'ny fampiasana ny Horvitz-Thompson (eq 3.2).

Na dia tsy mitovy hevitra aza ny mpandinika Horvitz-Thompson, dia afaka manombana marimaritra marim-pototra kokoa (oh., Ambany ambany) amin'ny fampifangaroana ilay ohatra miaraka amin'ny fampahalalana fanampiana . Ny olona sasany dia mahita fa mahagaga fa marina izany na dia misy ny fametrahana am-pahombiazana tanteraka aza. Ireo teknika izay mampiasa fampahalalana fanampiny dia tena zava-dehibe satria, araka izay asehoko taty aoriana, ny fampahalalana fanampiny dia tena manakiana ny fanombanana tombana avy amin'ireo problema azo tsapain-tanana miaraka amin'ny tsy famerenana sy ny tsy fahombiazan'ny samples.

Teknika iray iombonana amin'ny fampiasana ny fampahalalana fanampiny dia post-stratification . Alao sary an-tsaina, ohatra, fa ny mpikaroka dia mahafantatra ny isan'ireo lehilahy sy vehivavy ao amin'ireo firenena 50; Azontsika atao ny manamarika ireo sokajin'olona ireo toy ny \(N_1, N_2, \ldots, N_{100}\) . Mba hampifandraisana ity fampahalalana fanampiny ity miaraka amin'ilay santionany, ny mpikaroka dia afaka mizara ny santionany amin'ny sokajy \(H\) (amin'ity tranga ity 100), manao tombanana ho an'ny vondrona tsirairay, ary avy eo dia mamorona lanjany midadasika izay midika hoe:

\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]

Raha ny marina, ny mpandinika ao amin'ny eq. 3.5 dia azo antoka fa marina kokoa satria ampiasainy ny fampahalalana momba ny mponina - ny \(N_h\) - ny fanombatombana marina raha toa ka misy ny santionany tsy mitovy. Ny fomba iray hieritreretana azy dia ny fampitomboana ny tari-dàlana araka ny tokony ho izy raha toa ka efa voangona ny angon-drakitra.

Eo am-pamaranana, ity fizarana ity dia namaritra ny famolavolan-tsakafo vitsivitsy: tsipika samihafa tsotra tsy misy fanoloana, famintinana ny mety hitranga tsy mety, ary fametrahana fitomboana. Nolazainy ihany koa ny hevitra roa manan-danja mikasika ny tomban'ezaka: ny mpandinika Horvitz-Thompson sy ny fanoratana lahatsoratra. Ho an'ny famaritana mazava kokoa ny famolavolana fakan-tsary azo tsapain-tanana dia jereo ny toko 2 amin'ny Särndal, Swensson, and Wretman (2003) . Ho an'ny fitsaboana amin'ny fomba ofisialy sy amin'ny endriny samihafa, jereo ny fizarana 3.7 amin'ny Särndal, Swensson, and Wretman (2003) . Ho an'ny famaritana ara-teknika momba ny fananganana ny Horvitz-Thompson, dia jereo ny Horvitz and Thompson (1952) , Overton and Stehman (1995) , na fizarana 2.8 an'ny sarndal_model_2003. Ho an'ny fanarahan- Särndal, Swensson, and Wretman (2003) - Särndal, Swensson, and Wretman (2003) kokoa, jereo Holt and Smith (1979) , Smith (1991) , Little (1993) , na fizarana 7.6 amin'ny Särndal, Swensson, and Wretman (2003) .

Famakiana fisedrana amin'ny tsy fitongilanana

Saika ny fanadihadiana rehetra dia tsy misy valiny; Izany hoe, tsy ny olona rehetra ao amin'ny vahoaka samihafa no mamaly ny fanontaniana rehetra. Misy karazany roa tsy resy lahatra: singa tsy resy lahatra sy tsy misy valiny . Ao amin'ny nonresponse, ny sasany dia tsy mamaly zavatra sasany (ohatra, indraindray, tsy te-hamaly fanontaniana izay heveriny fa mahatsiaro) ny sasany. Ao amin'ny tsy fitongilan'ny vondrona, ny olona sasany izay voafidy ho an'ny mponina dia tsy mamaly ny fanadihadiana mihitsy. Ny antony roa mahazatra indrindra dia ny tsy fisalasalan'ny tarika dia ny tsy ahafahana mifandray amin'ny olona voafantina ary ny fifandraisana amin'ny olona dia tsy mety mandray anjara. Amin'ity fizarana ity dia hifantoka amin'ny tsy fisian'ny antoko aho; Ireo mpamaky liana amin'ny zavatra tsy resy lahatra dia tokony hahita an'i Little and Rubin (2002) .

Matetika ny mpikaroka dia mieritreritra ny fanadihadiana miaraka amin'ny valin-kafatra toy ny dingana roa samihafa. Eo amin'ny sehatra voalohany, ny mpikaroka dia mifidy santionany \(s\) ahafahan'ny olona tsirairay manana tombontsoa hampidirina \(\pi_i\) (aiza \(0 < \pi_i \leq 1\) ). Avy eo, eo amin'ny dingana faharoa, ny olona voafantina ao amin'ilay ohatra dia mamaly amin'ny mety ho \(\phi_i\) (aiza \(0 < \phi_i \leq 1\) ). Ity dingana faharoa ity dia mitarika ny valin'ny fanadihadiana farany \(r\) . Ny fahasamihafana lehibe eo amin'ireo dingana roa ireo dia ny fikarohan'ireo mpikaroka ny dingana mifantina ny santionany, saingy tsy manara-maso izay mety ho raisin'ireo olona nalaina ireo. Mampifandray ireo dingana roa ireo, ny mety hitranga amin'ny olona iray dia ny olona iray

\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]

Noho ny fahatsoram-po, heveriko ny tranga ahafahana mamolavola tsindrim-peo samihafa tsotra nefa tsy misy fanoloana. Raha misy mpikaroka iray mifidy santionany amin'ny habeny \(n_s\) izay manome \(n_r\) , ary raha tsy miraharaha ny tsy valiny ny mpikaroka ary mampiasa ny dikan'ny hoe voavaly, dia:

\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]

\(cor(\phi, y)\) dia ny fifandraisan'ny mponina eo amin'ny valim-panontaniana sy ny vokatra (ohatra ny toetry ny tsy fananana asa), \(S(y)\) toerana), \(S(\phi)\) dia ny mponina faneva fahadisoan-dàlana ny valin fironana, ary \(\bar{\phi}\) dia ny mponina hoe valinteny fironana (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .

Eq. 3.7 dia maneho fa ny tsy fitongilanana dia tsy hampiditra fitongilanana raha toa ka misy ny fepetra manaraka:

  • Tsy misy fiovaovana eo amin'ny toeran'ny tsy fananan'asa \((S(y) = 0)\) .
  • Tsy misy ny fiovaovana eo amin'ny fametahana valiny \((S(\phi) = 0)\) .
  • Tsy misy fifandraisana eo amin'ny fihenan'ny valim-panontaniana sy ny toeran'ny tsy fananan'asa \((cor(\phi, y) = 0)\) .

Indrisy anefa fa tsy misy toa an'izany. Toa tsy azo inoana fa tsy hisy fiovàna eo amin'ny toeran'ny asa na ny tsy fisian'ny fiovan'ny valin-kafatra. Noho izany, ny teny fototra amin'ny eq. 3.7 ny fifandraisana: \(cor(\phi, y)\) . Ohatra, raha toa ka misy olona tsy an'asa no mety hamaly, dia ny tahan'ny asa eo an-dalam-pandrosoana no hikomy.

Ny tetika hanaovana fanombanana rehefa tsy misy valiny dia ny fampiasana ny fampahalalana fanampiny. Ohatra, fomba iray ahafahanao mampiasa fampahalalana fanampiana dia ny fanoratana lahatsoratra (tsindrio ny 3.5 fantsona ambony). Hitany fa ny tebitebin'ny fanatsarana ny post-stratification dia:

\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]

izay \(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) , ary \(\bar{\phi}^{(h)}\) dia voafaritra toy ny etsy ambony fa voafetra ho an'ny olona ao amin'ny vondrona \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) . Noho izany dia ho kely ny fitongilanana ankapobeny raha kely ny fitongilanana eo amin'ny tarika tsirairay. Misy fomba roa izay tiako hieritreretana ny hampiako kely ny vondrona tsirairay ao amin'ny tarika tsirairay. Voalohany, te hanandrana hanangona vondrona tsy miray feo izay tsy dia misy fiovàna firy amin'ny hakanton'ny valiny ( \(S(\phi)^{(h)} \approx 0\) ) ary ny vokatra ( \(S(y)^{(h)} \approx 0\) ). Faharoa, te-hamorona vondrona izay hitan'ny olona hitanao ny olona izay tsy hitanao ( \(cor(\phi, y)^{(h)} \approx 0\) ). Fampitahana eq. 3.7 sy eq. 3.8 dia manampy amin'ny fanamafisana hoe rehefa mampitombo ny fitongilanana vokatry ny tsy fitongilanana dia mety hampihena ny fihoaram-pefy.

Eo am-pamaranana, ity fizarana ity dia nanome modely ho an'ny famahanam-pahaiza-mamorona amin'ny tsy famaliana, ary mampiseho ny fitongilanana fa ny tsy famoahana dia afaka mampiditra na tsia amin'ny fanitsiana ny fanoratana lahatsoratra. Bethlehem (1988) manolotra ny voka-dratsy ateraky ny tsy famerenana amin'ny famolavolana tsipika misimisy kokoa. Raha te-hahalala bebe kokoa momba ny fampiasana post-stratification mba hanitsiana ny tsy famaliana dia jereo ny Smith (1991) sy Gelman and Carlin (2002) . Ny fanoratana lahatsoratra dia Särndal and Lundström (2005) ankapobeny ara-teknika antsoina hoe fananganana kalibration, jereo ny Zhang (2000) ho an'ny fitsaboana amin'ny lahatsoratra ary Särndal and Lundström (2005) ho an'ny fitsaboana boky. Raha mila fanampim-panazavana momba ireo fomba hafa entina hanatsarana ny tsy Kalton and Flores-Cervantes (2003) , jereo ny Kalton and Flores-Cervantes (2003) , Brick (2013) , sy Särndal and Lundström (2005) .

Ny tsy fahombiazan'ny famandrihana

Ny fakan-tsarimihetsika tsy misy azo atao dia ahitana karazany maro (Baker et al. 2013) . Ny fifantohana manokana amin'ny ohatr'ireo mpampiasa Xbox an'ny Wang sy ireo mpiara-miasa (W. Wang et al. 2015) azonao eritreretina io karazam-pampianarana io ho toy ny iray izay ny ampahany manan-danja amin'ny famolavolana tetikasa dia tsy ny \(\pi_i\) ( ny mety \(\phi_i\) ny mpikaroka amin'ny sehatry ny fikarohana) fa ny \(\phi_i\) (ny \(\phi_i\) valin-kafatra). Mazava ho azy fa tsy tsara izany satria ny \(\phi_i\) dia tsy fantatra. Saingy, araka ny nasehon'i Wang sy ny mpiara-miasa, ity karazana safidy an-tsoratra ity-na dia avy amin'ny fametrahana fakantsary misy hadisoana goavambe aza - dia tsy ilaina ny mampidi-kisendrasendra raha toa ny mpikaroka manana fampahalalana vondrona tsara sy tsara tarehy ho an'ny antontan'isa.

Bethlehem (2010) dia manitatra ny ankamaroan 'ireo fanovàna etsy ambony ireo momba ny fanoratana ny lahatsoratra ho fanatsarana ny tsy famerenana sy ny fandrakofana fandrakofana. Ankoatra ny post-stratification, teknika hafa fa niara-niasa tamin'ny tsy mety santionany-ary mety santionany amin'ny fandrakofana fahadisoana sy ny nonresponse-ahitana santionany mifandraika (Ansolabehere and Rivers 2013; ??? ) , fironana isa weighting (Lee 2006; Schonlau et al. 2009) , ary ny kalibration (Lee and Valliant 2009) . Ny foto-kevitra iraisana amin'ireo teknika ireo dia ny fampiasana ny fampahalalana fanampiny.