Fanamarihana matematika

Heveriko fa ny fomba tsara indrindra hahatakarana ny fanandramana dia ny rafitra mety ho vokatra azo (izay noresahiko tao amin'ny fanamarihana matematika ao amin'ny toko 2). Ny rafitra mety ho vokatra mety dia manana fifandraisana akaiky amin'ny hevitra avy amin'ny famolavolana noforonina noforonina tao amin'ny toko faha-3 (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) . Ity appendise ity dia nosoratana tamin'ny fomba toy izany hanamafisana io fifandraisana io. Ity lohahevitra ity dia somary tsy nentim-paharazana, saingy heveriko fa ny fifandraisana misy eo amin'ny famolavolana sy ny fanandramana dia manampy: midika izany fa raha mahafantatra zavatra momba ny famolavolana ianao dia fantatrao momba ny fanandramana sy ny mifamadika amin'izany. Araka ny asehoko ao anatin'ireny fanamarihana ireny, ny rafitra vokatra mety dia maneho ny tanjaky ny fanandramana mifehy tsy tapaka amin'ny fanombantombanana ny vokatra azo, ary mampiseho ny fetran'ny mety ho vita amin'ny fanandramana tena tanteraka.

Ao anatin'ity appendise ity dia hamaritra ny fepetra mety ho vokatra azo atao aho, ka mamoaka ny sasantsasany avy amin'ny fanamarihana matematika ao amin'ny toko faha-2 mba ahafahana mampiavaka ireo fanamarihana ireo. Avy eo dia hilazalaza ny valiny mahasoa momba ny famaritana ny fiantraikan'ny fitsaboana amin'ny ankapobeny, anisan'izany ny fifanakalozan-kevitra momba ny fandefasana tsara sy ny fahasamihafana isan-karazany. Ity appendice ity dia manintona mafy ny Gerber and Green (2012) .

Ny rafitra vokatra mety

Mba hampisehoana ny rafitra mety ho vokatra, avelao hiverina any amin'ny fanandraman'i Restivo sy van de Rijt izahay mba hanombanana ny fiantraikan'ny fandraisana ny barnstar amin'ny fanampiana ho an'i Wikipedia. Ny singa fototra mety ho vokatra dia misy singa fototra telo: singa , fitsaboana ary vokatra mety . Raha ny momba ny Restivo sy van de Rijt, dia mendrika ireo mpanonta ireo ny singa -ireo ao amin'ny 1% -n'ireo mpandray anjara-izay mbola tsy nahazo barnstar. Azontsika atao ny mandanjalanja ireo mpanonta ireo amin'ny \(i = 1 \ldots N\) . Ny fitsaboana amin'ny fanandraman-dry zareo dia "barnstar" na "tsy misy barnstar", ary izaho dia hanoratra \(W_i = 1\) raha toa ny olona \(i\) dia eo amin'ny toetry ny fitsaboana ary \(W_i = 0\) raha tsy izany. Ny singa fahatelo amin'ny fepetra mety ho vokatra mety no zava-dehibe: ny vokatra mety . Mora kokoa noho izany izy ireo satria misy ny "mety" azo raisina-zavatra izay mety hitranga. Ho an'ny mpamoaka Wikipedia tsirairay, dia azonao alaina sary an-tsaina ny isan'ny fanovana izay hataony amin'ny toeram-pitsaboana ( \(Y_i(1)\) ) ary ny isa izay azony atao ao amin'ny fehezan-dalàna ( \(Y_i(0)\) ).

Mariho fa ity safidin'ny tarika sy fitsaboana ary vokatra ity dia mamaritra izay azo ianarana avy amin'ity fanandramana ity. Ohatra, raha tsy misy ny hevitra fanampiny, Restivo sy van de Rijt dia tsy afaka milaza na inona na inona momba ny vokatry ny barnstars amin'ny mpamoaka Wikipedia rehetra na amin'ny vokatra tahaka ny fanitsiana kalitao. Amin'ny ankapobeny, ny safidy amin'ny singa, fitsaboana ary ny vokatra dia tokony hifototra amin'ny tanjon'ny fianarana.

Raha jerena ireo vokatra mety hitranga-izay voafaoka ao amin'ny latabatra 4.5-ny iray dia afaka mamaritra ny vokatra azo avy amin'ny fitsaboana ho an'ny olona \(i\) as

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]

Ho ahy, io fihetsika io no fomba mazava indrindra hamaritana ny vokatra azo, ary, na dia tsotra aza, ity rafitra ity dia lasa azo (Imbens and Rubin 2015) fomba manan-danja sy mahaliana (Imbens and Rubin 2015) .

Tabilao 4.5: Tabilao ny vokatra mety
olona Mandeha amin'ny fitsaboana Manova ny fepetra fanaraha-maso Ny vokatra fitandremana
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
N \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
midika \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

Raha mamaritra ny antony mahatonga izany anefa isika, dia mihazakazaka ho olana. Amin'ny ankamaroan'ny tranga rehetra, tsy mahazo mijery ny vokatra mety isika. Izany hoe, mpampiasa Wikipedia manokana no nahazo barnstar na tsia. Noho izany, hitanay ny iray amin'ireo mety ho vokatr'izany- \(Y_i(1)\) na \(Y_i(0)\) -na izy roa. Ny tsy fahafahana mitazona ny vokatra mety amin'ny vokatra mety dia olana lehibe iray izay nantsoin'i Holland (1986) azy io ny fototry ny olana momba ny fampidiran-kery .

Soa ihany, rehefa manao fikarohana isika dia tsy manana olona iray ihany, manana olona maro isika, ary manolotra fomba iray manodidina ny olana fototra momba ny fampidiran-kery. Tsy manandrana manombana ny fiantraikan'ny fitsaboana tsirairay, fa azontsika atao ny manombatombana ny vokatr'ilay fitsaboana:

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]

Izany dia mbola maneho ny momba ny \(\tau_i\) izay tsy azo tsinontsinoavina, fa miaraka amin'ny algebra (Gl. 2.8 amin'ny Gerber and Green (2012) )

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]

Mira 4.3 mampiseho fa raha afaka Tombanan'ny ny mponina eo ho eo ny vokatra eo ambany fitsaboana ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) sy ny mponina eo ho eo ny vokatra eo ambany fanaraha-maso ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), dia azontsika atao ny manombana ny fiantraikan'ny fitsaboana amin'ny ankapobeny, na dia tsy manombantombana ny fiasan'ny mpitsabo aza.

Amin'izao fotoana izao no namariparitako ny fanombatombana-ny zavatra tadiavinay hofanina-Izaho dia hitodika amin'ny fomba azonay tombanana amin'ny data. Tiako ny mieritreritra an'io fanamby sarobidy io ho toy ny olana sampling (eritrereto amin'ny matematika ao amin'ny toko 3). Alaivo sary an-tsaina hoe misintona olona maromaro izahay mba hijery amin'ny toe-pahasalamana ary manintona ny olona sasany mba hitandrina amin'ny fepetra fanaraha-maso, dia azontsika atao ny manombatombana ny vokatr'izany amin'ny toe-javatra tsirairay:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]

izay \(N_t\) sy \(N_c\) no isa ny olona ao amin'ny fitsaboana sy ny fepetra fitsaboana. Ny Equation 4.4 dia mpandinika ny fahasamihafana. Noho ny famolavolana tetikasa dia fantatsika fa ny fe-potoana voalohany dia tsy fanombanana ny vokatry ny fitsaboana amin'ny alàlan'ny fitsaboana ary ny fe-potoam-piasana faharoa dia fitomboana tsy manam-paharoa eo ambany fifehezana.

Ny fomba iray hafa hieritreretana ny fahafahan'ny randomization dia ny fiantohana fa ny fampitahana eo amin'ny tarika fitsaboana sy ny fifehezana dia marina raha toa ka miantoka ny vondrona roa ny roa tonta. Io fitoviana io dia mitazona ny zavatra nodinihinay (ambarao ny isan'ny fanitsiana mandritra ny 30 andro mialoha ny fanandramana) sy ny zavatra tsy nodiantsika (miteny hoe lahy). Izany fahafahana mba hahazoana antoka mandanjalanja eo amin'ny samy nandinika sy unobserved lafin-javatra dia dehibe. Raha te hahita ny herin'ny fandehanana automatique amin'ny zavatra tsy hita maso, andeha hojerentsika fa ny fikarohana fanao amin'ny ho avy dia mahita fa ny lehilahy dia mihaino kokoa ny loka noho ny vehivavy. Mety hamaly ny vokatry ny fanandraman'i Restivo sy van de Rijt ve izany? Tsia. Nalaza izy ireo, ka nokarakarain'izy ireo fa tsy hahay handanjalanja ny rehetra. Tena fiarovana io fiarovana io ho an'ny tsy fantatra, ary fomba iray manan-danja ny fahasamihafan'ny fanandramana amin'ireo teknolojia tsy hita maso voalaza ao amin'ny toko faha-2.

Ankoatra ny famaritana ny vokatry ny fitsaboana ho an'ny mponina iray manontolo, dia azo atao ny mamaritra ny fiantraikan'ny fitsaboana ho an'ny olona iray. Izany dia antsoina matetika hoe fiantraikan'ny fitondran-tena arahina (CATE). Ohatra, ao amin'ny fandalin'i Restivo sy van de Rijt, andeha hojerentsika fa \(X_i\) dia raha ny tonian'ny tonian-dahatsoratra no ambony na ambany ambanin'ny mediam-panitsiana nandritra ny 90 andro talohan'ny fanandramana. Azonao atao ny manombatombana ny fisian'ny fitsaboana an-tsokosoko ho an'ireo tonian-dahatsoratra sy mavesatra ireo.

Ny rafitra mety ho vokatra mety dia fomba mahery azo eritreretina momba ny fampidiran-dra sy ny fanandramana. Na izany aza dia misy zavatra roa hafa tokony hotadidinao. Ireo zavatra roa ireo fahasarotan'ny dia matetika miaraka lumped ambany ny teny hoe tranon'omby Unit fitsaboana Value fiheverana (SUTVA). Ny ampahany voalohany amin'ny SUTVA dia ny fiheverana fa ny hany zavatra manan-danja ho an'ny olona \(i\) 's ny vokatr'izany dia raha io olona io dia tao amin'ny fitondrana na ny fepetra fanaraha-maso. Amin'ny teny hafa dia heverina fa ny olona \(i\) dia tsy misy fiantraikany amin'ny fitsaboana omena ny olon-kafa. Indraindray dia antsoina hoe "tsy misy fanelingelenana" na "tsy misy solika", ary azo soratana amin'ny:

\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]

Ny toerana \(\mathbf{W_{-i}}\) dia singa maromaro momba ny fitsaboana ho an'ny olon-drehetra afa-tsy ny olona \(i\) . Ny fomba iray ahafahana manilika an'io dia ny fitsaboana ny olona iray amin'ny olona iray, na mety na tsy mety. Raha miverina amin'ny fanandramana ry Rivo sy Van de Rijt dia alaivo sary an-tsaina hoe namana anankiroa \(i\) sy \(j\) ary ny olona \(i\) mandray barnstar ary \(j\) dia tsy. Raha \(i\) mandray ny barnstar dia miteraka \(j\) hanitsy bebe kokoa (avy amin'ny fahatsapana fifaninanana) na hanova kely (avy amin'ny fahatsapan'ny fahadisoam-panantenana), dia nodikaina ny SUTVA. Mety hanitsakitsaka azy io koa izy raha toa ka misy fiantraikany amin'ny fitsaboana ny isan'ny olona mahazo ny fitsaboana. Ohatra, raha ny Restivo sy van de Rijt no nanome baoty 1,000 na 10 000 raha tokony ho 100, dia mety hisy fiantraikany eo amin'ny vokany ny fahazoana barnstar.

Ny olana faharoa natsipy tao amin'ny SUTVA dia ny fiheverana fa ny fitsaboana tokana dia ny iray entin'ny mpikaroka; Izany toe-javatra izany indraindray dia tsy antsoina hoe fitsaboana miafina na tsy fahombiazana . Ohatra, ao amin'ny Restivo sy van de Rijt, mety ho ilay tranga izay tamin'ny famoahana barnstar ny mpikaroka dia nahatonga ireo mpanonta nasongadina tao amin'ny pejin'ny mpamoaka malaza, ary teo amin'ny pejin'ny mpamoaka malaza - fa tsy nahazo ny barnstar- izay nahatonga ny fanovana amin'ny fihetsika manitsy. Raha marina izany, ny vokatr'ilay barnstar dia tsy manavaka ny vokatr'izany eo amin'ny sehatry ny editors malaza. Mazava ho azy fa tsy mazava ny, raha avy amin'ny fomba fijerin'ny siansa, dia tokony heverina ho manintona na tsy mahasarika izany. Izany hoe, azonao eritreretina fa misy mpikaroka iray milaza fa ny vokatry ny fandraisana barnstar dia ahitana ny fitsaboana manaraka izay manomboka ny barnstar. Na azonao alaina sary an-tsaina ny toe-javatra iray izay ahitan'ny fikarohana iray hisoroka ny vokatry ny barnstars amin'ny zavatra hafa rehetra. Ny fomba iray hieritreretana azy dia ny manontany raha misy zavatra izay mitondra any amin'ny Gerber and Green (2012) (p. 41) dia miantso ny "fisarahana amin'ny sintometry"? Raha lazaina amin'ny teny hafa dia misy zavatra hafa ankoatra ny fitsaboana izay mahatonga ny olona amin'ny fitondran-tena sy ny fanaraha-maso ny fahasalamana amin'ny fomba hafa. Ny ahiahy momba ny fandrenesana tsimok'aretina dia inona no mitarika ny marary ao amin'ny vondrona fitsaboana amin'ny fitsaboana ara-pitsaboana mba haka fanaingoana pilina. Amin'izany fomba izany, ireo mpikaroka dia afaka mahazo antoka fa ny fahasamihafana eo amin'ny toe-javatra roa dia ny fanafody fa tsy ny traikefan-tsakafo.

Ho an'ny SUTVA, jereo ny fizarana 2.7 amin'ny Gerber and Green (2012) , fizarana faha-2 an'i Morgan and Winship (2014) , ary ny fizarana 1.6 amin'ny Imbens and Rubin (2015) .

fametrahana mazava tsara

Ao amin'ny fizarana teo aloha, nanoritsoritra ny fomba fanombantombanana ny vokatry ny fitsaboana aho. Amin'ity fizarana ity, dia hanome hevitra sasantsasany momba ny fihanaky ny tombantomban'ireny tomban'ezaka ireny aho.

Raha mieritreritra ny fanombantombanana ny fiantraikan'ny fitsaboana ianao rehefa manombatombana ny fahasamihafana misy eo amin'ny fitaovana roa samihafa, dia azo atao ny mampiseho fa ny fahadisoana ankapobeny amin'ny fiantraikany amin'ny fitsaboana dia:

\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]

izay \(m\) ny olona voatendry ho fitsaboana sy ny \(Nm\) mifehy (jereo ny Gerber and Green (2012) , eq. 3.4). Araka izany, rehefa mieritreritra ny habetsaky ny olona manome ny fitsaboana sy ny \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) ianao, dia afaka mahita fa raha \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) , dia mila \(m \approx N / 2\) , raha mbola mitovy ny fandaniana sy fitsaboana. Ny Equation 4.6 dia manazava ny antony tsy nanandramana ny fananganana ny Bond sy ny mpiara-miasa (2012) momba ny vokatry ny fampahalalam-baovao amin'ny fifidianana (sary 4.18). Tsarovy fa 98% ny mpandray anjara tamin'ny fitondran-tena. Izany dia midika fa ny fihetsika ateraky ny fehezan-dalàna mifehy ny fitondram-panjakana dia tsy voamarina araka ny tokony ho izy raha azo atao izany, izay midika fa ny fahasamihafana eo amin'ny fitsaboana sy ny fepetra fitsaboana dia tsy novinavina araka ny tokony ho izy. Raha te-hahalala bebe kokoa momba ny fepetra tsara indrindra ny mpandray anjara, ka ao anatin'izany ny vidin'ny fahasamihafana eo amin'ny toe-javatra, jereo List, Sadoff, and Wagner (2011) .

Farany, tao amin'ny lahatsoratra fototra, dia nanoritsoritako ny fomba ahafahana manatsara ny fahasamihafana amin'ny fahasamihafana, izay ampiasaina amin'ny fomba famolavolana azy, dia mety hitarika ho amin'ny fihenan-keloka madinika kokoa noho ny mpandinika ny fahasamihafan'ny fahasamihafana, izay ampiasaina matetika amin'ny lohahevitra famolavolana. Raha \(X_i\) no lanjan'ny vokatry alohan'ny fitsaboana, dia ny habetsaky ny tadiavintsika dia ny manombatombana amin'ny fomba fiasa manakaiky ny fahasamihafana:

\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]

Ny fahadisoana nomerika amin'io habaka io dia jereo (jereo ny Gerber and Green (2012) , ny andininy 4.4)

\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]

Ny fampitahana ny eq. 4.6 sy eq. 4.8 dia maneho fa ny fahatakarana ny fahasamihafan'ny fahasamihafana dia hanana fahadisoana kely kokoa raha jerena (jereo ny Gerber and Green (2012) , ny andininy 4.6)

\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]

Raha ny marina, raha \(X_i\) dia maminavina tanteraka ny \(Y_i(1)\) ary \(Y_i(0)\) , dia azonao atao ny manombatombana mialoha kokoa ny fomba fiasa mifanohitra amin'ny fahasamihafana- midika hoe iray. Ny fomba iray hieritreretana izany ao anatin'ny sehatry ny fanandraman'i Restivo sy van de Rijt dia hoe misy fiovan'ny voa isan-karazany amin'ny habetsahan'ny olona nohavaozina, ka noho izany dia mampitaha ny fahasalamana sy ny fanaraha-maso ny fahasalamana: sarotra ny mamantatra ny havany voka-dratsy kely amin'ny angon-drakitra. Saingy raha toa ka mampitovy ny fihanaky ny natiora voajanahary ianao, dia tsy dia misy dikany loatra izany, ary mahatonga azy io ho mora kokoa ny mamantatra ny vokatra kely.

Jereo ny Frison and Pocock (1992) ho an'ny fampitahana mazava kokoa ny fahasamihafana-ny fomba, ny fahasamihafan'ny fahasamihafana, ary ny fomba ambaran'ny ANCOVA amin'ny sehatra ankapobeny izay misy famerana maromaro alohan'ny fitsaboana sy ny fitsaboana. Indrindra indrindra, manoro hevitra ny ANCOVA izy ireo, izay tsy nafeniko eto. Ankoatra izany, jereo ny McKenzie (2012) ho an'ny adihevitra momba ny maha-zava-dehibe ny fepetra momba ny fitsaboana marobe manaraka.