Wiskundige aantekeninge

In hierdie bylaag sal ek 'n paar opsommings opsom oor die maak van kousale inferensie van nie-eksperimentele data in 'n bietjie meer wiskundige vorm. Daar is twee hoof benaderings: die oorsaaklike grafiek raamwerk, die meeste geassosieer met Judea Pearl en kollegas, en die potensiële uitkoms raamwerk, die meeste geassosieer met Donald Rubin en kollegas. Ek sal die potensiële uitkomsraamwerk bekendstel omdat dit nouer aan die idees in die wiskundige aantekeninge aan die einde van hoofstukke 3 en 4 gekoppel is. Vir meer oor die kousale grafiese raamwerk, beveel ek Pearl, Glymour, and Jewell (2016) (inleidend ) en Pearl (2009) (gevorderd). Vir 'n boeklengte behandeling van kousale inferensie wat die potensiële uitkomsraamwerk en die oorsaaklike Morgan and Winship (2014) kombineer, beveel ek Morgan and Winship (2014) .

Die doel van hierdie bylaag is om jou te help om gemaklik te raak met die notasie en styl van die potensiële uitkomsradisie sodat jy kan oorgaan na sommige van die meer tegniese materiaal wat oor hierdie onderwerp geskryf is. Eerstens sal ek die potensiële uitkomste raamwerk beskryf. Dan sal ek dit gebruik om natuurlike eksperimente soos die een deur Angrist (1990) oor die invloed van militêre diens op verdienste verder te bespreek. Hierdie bylaag trek sterk op Imbens and Rubin (2015) .

Potensiële uitkomste raamwerk

Die potensiële uitkomsraamwerk het drie hoofelemente: eenhede , behandelings en moontlike uitkomste . Om hierdie elemente te illustreer, kom ons kyk na 'n gestileerde weergawe van die vraag wat in Angrist (1990) aangespreek is: Wat is die uitwerking van militêre diens op verdienste? In hierdie geval kan ons die eenhede definieer wat mense in aanmerking kom vir die 1970-konsep in die Verenigde State, en ons kan hierdie mense indekseer met \(i = 1, \ldots, N\) . Die behandelings in hierdie geval kan wees "in diens van die militêre" of "nie in diens van die weermag." Ek sal hierdie die behandeling en beheer voorwaardes noem, en ek sal skryf \(W_i = 1\) as persoon \(i\) is in die behandelingstoestand en \(W_i = 0\) as persoon \(i\) in die beheer toestand is. Laastens is die potensiële uitkomste bietjie meer konseptueel moeilik omdat dit "potensiële" uitkomste behels; dinge wat kon gebeur het. Vir elke persoon wat in aanmerking kom vir die 1970-konsep, kan ons die bedrag wat hulle in 1978 verdien het, voorstel as hulle in die weermag gedien het, wat ek sal noem \(Y_i(1)\) en die bedrag wat hulle sou verdien het in 1978 as hulle nie in die weermag gedien het nie, wat ek sal noem \(Y_i(0)\) . In die potensiële uitkomste raamwerk word \(Y_i(1)\) en \(Y_i(0)\) as vaste hoeveelhede beskou, terwyl \(W_i\) 'n ewekansige veranderlike is.

Die keuse van eenhede, behandelings en uitkomste is krities omdat dit definieer wat kan en kan nie uit die studie geleer word nie. Die keuse van eenhede - mense wat in aanmerking kom vir die 1970-konsep - sluit nie vroue in nie, en dus sonder addisionele aannames, sal hierdie studie ons niks vertel oor die uitwerking van militêre diens op vroue nie. Besluite oor hoe om behandelings en uitkomste te definieer, is ook belangrik. Byvoorbeeld, moet die behandeling van belangstelling daarop gemik wees om in die weermag te dien of om te veg? Moet die uitkoms van rente verdienste of werkstevredenheid wees? Uiteindelik moet die keuse van eenhede, behandelings en uitkomste gedryf word deur die wetenskaplike en beleidsdoelwitte van die studie.

Gegewe die keuses van eenhede, behandelings en moontlike uitkomste, is die oorsaaklike effek van die behandeling op persoon \(i\) , \(\tau_i\) ,

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]

Met ander woorde, ons vergelyk hoeveel persoon \(i\) sou verdien nadat hy gedien het hoeveel persoon \(i\) sou verdien het sonder om te dien. Vir my, ek. 2.1 is die duidelikste manier om 'n oorsaaklike effek te definieer, en hoewel dit baie eenvoudig is, is hierdie raamwerk op baie belangrike en interessante maniere (Imbens and Rubin 2015) veralgemeenbaar.

By die gebruik van die potensiële uitkomste raamwerk, vind ek dit dikwels nuttig om 'n tabel te skryf wat die potensiële uitkomste en die behandelingseffekte vir alle eenhede toon (tabel 2.5). As jy nie so 'n tafel soos hierdie vir jou studie kan voorstel nie, moet jy dalk meer presies wees in jou definisies van jou eenhede, behandelings en moontlike uitkomste.

Tabel 2.5: Tabel van Potensiële Uitkomste
persoon Verdienste in behandelingstoestand Verdienste in beheer toestand Behandeling effek
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
Beteken \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

Wanneer ons die oorsaaklike effek op hierdie manier definieer, loop ons egter 'n probleem in. In byna alle gevalle kry ons nie albei moontlike uitkomste nie. Dit is, 'n spesifieke persoon het ook gedien of nie gedien nie. Daarom beskou ons een van die moontlike uitkomste- \(Y_i(1)\) of \(Y_i(0)\) - maar nie albei nie. Die onvermoë om beide potensiële uitkomste te waarneem, is so 'n groot probleem dat Holland (1986) dit die Fundamentele Probleem van Kousale Inferensie noem .

Gelukkig, as ons navorsing doen, het ons nie net een persoon nie; Ons het eerder baie mense, en dit bied 'n manier om die fundamentele probleem van oorsaaklike inferensie. In plaas daarvan om die individuele vlak-effek te beoordeel, kan ons die gemiddelde behandelingseffek vir alle eenhede skat:

\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]

Hierdie vergelyking word steeds uitgedruk in terme van die \(\tau_i\) , wat onwaarneembaar is, maar met 'n paar algebra (eq 2.8 van Gerber and Green (2012) ) kry ons

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]

Dit dui aan dat as ons die populasie gemiddelde uitkoms onder behandeling kan skat ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) en die populasie gemiddelde uitkoms onder beheer ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) , dan kan ons die gemiddelde behandelingseffek skat, selfs sonder om die behandelingseffek vir enige bepaalde persoon te skat.

Noudat ek ons ​​ramand gedefinieer het - die ding wat ons probeer skat - gaan ek na hoe ons dit eintlik met data kan skat. En hier loop ons direk in die probleem dat ons net een van die potensiële uitkomste vir elke persoon waarneem; ons sien óf \(Y_i(0)\) of \(Y_i(1)\) (tabel 2.6). Ons kan die gemiddelde behandelingseffek skat deur die verdienste van mense wat gedien het, te vergelyk met die verdienste van mense wat nie gedien het nie:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]

waar \(N_t\) en \(N_c\) is die getalle mense in die behandelings- en beheerstoestande. Hierdie benadering sal goed werk as die behandelingsopdrag onafhanklik is van potensiële uitkomste, 'n toestand wat soms onkundig genoem word . Ongelukkig, as die eksperiment ontbreek, word onkunde nie dikwels tevrede nie, wat beteken dat die beramer in eq. 2.4 sal waarskynlik nie goeie skatting lewer nie. Een manier om daaroor te dink, is dat in die afwesigheid van willekeurige opdrag van behandeling, eq. 2.4 vergelyk nie met soos nie; dit vergelyk die verdienste van verskillende soorte mense. Of andersins uitgedruk, sonder toevallige toewysing van behandeling, is die toedienings toewysing waarskynlik verwant aan potensiële uitkomste.

In hoofstuk 4 beskryf ek hoe gerandomiseerde beheerde eksperimente navorsers kan help om oorsaaklike ramings te maak, en hier beskryf ek hoe navorsers voordeel kan trek uit natuurlike eksperimente, soos die konsep lotery.

Tabel 2.6: Tabel van Gemonitorde Uitkomste
persoon Verdienste in behandelingstoestand Verdienste in beheer toestand Behandeling effek
1 ? \(Y_1(0)\) ?
2 \(Y_2(1)\) ? ?
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) ? ?
Beteken ? ? ?

Natuurlike eksperimente

Een benadering om oorsaaklike ramings te maak sonder om 'n eksperiment uit te voer, is om te kyk na iets wat in die wêreld gebeur wat ewekansig 'n behandeling vir jou toegeken het. Hierdie benadering word natuurlike eksperimente genoem . In baie gevalle lewer die natuur ongelukkig nie die behandeling wat jy wil hê aan die populasie van belangstelling nie. Maar soms lewer die natuur willekeurige verwante behandeling. In die besonder, sal ek die geval oorweeg waar daar sekondêre behandeling is wat mense aanmoedig om die primêre behandeling te ontvang. Byvoorbeeld, die konsep kan beskou word as 'n ewekansige toegekende sekondêre behandeling wat sommige mense aangemoedig het om die primêre behandeling, wat in die weermag bedien, te neem. Hierdie ontwerp word soms 'n bemoedigingsontwerp genoem. En die analise metode wat ek sal beskryf om hierdie situasie te hanteer, word soms instrumentele veranderlikes genoem . In hierdie omgewing, met sommige aannames, kan navorsers die aanmoediging gebruik om te leer oor die effek van die primêre behandeling vir 'n bepaalde deelstel eenhede.

Om die twee verskillende behandelings te hanteer, die aanmoediging en die primêre behandeling, benodig ons 'n paar nuwe notasies. Gestel sommige mense word lukraak opgestel ( \(Z_i = 1\) ) of nie opgestel nie ( \(Z_i = 0\) ); In hierdie situasie word \(Z_i\) soms 'n instrument genoem .

Onder diegene wat opgestel is, het sommige gedien ( \(Z_i = 1, W_i = 1\) ) en sommige het nie ( \(Z_i = 1, W_i = 0\) ). Net so, onder diegene wat nie opgestel is nie, het sommige gedien ( \(Z_i = 0, W_i = 1\) ) en sommige het nie ( \(Z_i = 0, W_i = 0\) ). Die potensiële uitkomste vir elke persoon kan nou uitgebrei word om hul status vir beide die aanmoediging en die behandeling te toon. Byvoorbeeld, laat \(Y(1, W_i(1))\) die verdienste van die persoon \(i\) as hy opgestel is, waar \(W_i(1)\) sy diensstatus is indien hy opgestel is. Verder kan ons die bevolking verdeel in vier groepe: versamelaars, nalatenaars, defiers en altyd-takers (tabel 2.7).

Tabel 2.7: Vier tipes mense
tipe Diens indien opgestel Diens indien nie opgestel nie
Compliers Ja, \(W_i(Z_i=1) = 1\) Nee, \(W_i(Z_i=0) = 0\)
Nooit-nemers Nee, \(W_i(Z_i=1) = 0\) Nee, \(W_i(Z_i=0) = 0\)
Defiers Nee, \(W_i(Z_i=1) = 0\) Ja, \(W_i(Z_i=0) = 1\)
Altyd-nemers Ja, \(W_i(Z_i=1) = 1\) Ja, \(W_i(Z_i=0) = 1\)

Voordat ons bespreek die effek van die behandeling (dws militêre diens), kan ons eers twee effekte van die aanmoediging definieer (dit word opgestel). Eerstens kan ons die effek van die aanmoediging op die primêre behandeling omskryf. Tweedens kan ons die effek van die aanmoediging op die uitkoms definieer. Dit sal blyk dat hierdie twee effekte gekombineer kan word om 'n skatting te gee van die effek van die behandeling op 'n spesifieke groep mense.

Eerstens kan die effek van die aanmoediging op behandeling gedefinieer word vir persoon \(i\) as

\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]

Verder kan hierdie hoeveelheid oor die hele bevolking gedefinieer word as

\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]

Laastens kan ons \(\text{ITT} _{W}\) skat met data:

\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]

waar \(\bar{W}^{\text{obs}}_1\) is die waargenome behandelingsgraad vir diegene wat aangemoedig is en \(\bar{W}^{\text{obs}}_0\) is die waargenome behandelingsgraad vir diegene wat nie aangemoedig is nie. \(\text{ITT}_W\) word ook soms die opname koers genoem .

Vervolgens kan die effek van die aanmoediging op die uitkoms vir persoon \(i\) gedefinieer word as:

\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]

Verder kan hierdie hoeveelheid oor die hele bevolking gedefinieer word as

\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]

Laastens kan ons \(\text{ITT}_{Y}\) skat met data:

\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]

waar \(\bar{Y}^{\text{obs}}_1\) is die waargenome uitkoms (bv. verdienste) vir diegene wat aangemoedig is (bv. opgestel) en \(\bar{W}^{\text{obs}}_0\) is die waargenome uitkoms vir diegene wat nie aangemoedig is nie.

Ten slotte wys ons ons aandag op die uitwerking van belangstelling: die uitwerking van die primêre behandeling (bv. Militêre diens) op die uitkoms (bv. Verdienste). Ongelukkig blyk dit dat 'n mens hierdie effek oor die algemeen nie kan skat nie. Met sommige aannames kan navorsers egter die effek van die behandeling op verskaffers skat (dit wil sê mense wat sal dien as hulle opgestel word en mense wat nie sal dien as hulle nie opgestel is nie, tabel 2.7). Ek sal hierdie beraming noem en die vergelykende gemiddelde oorsaaklike effek (CACE) (wat ook soms die plaaslike gemiddelde behandelingseffek genoem word ):

\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]

waar \(G_i\) die groep persoon skenk \(i\) (sien tabel 2.7) en \(N_{\text{co}}\) is die aantal versamelaars. Met ander woorde, eq. 2.11 vergelyk die verdienste van verskaffers wat opgestel word \(Y_i(1, W_i(1))\) en nie opgestel nie \(Y_i(0, W_i(0))\) . Die skatting in eq. 2.11 lyk moeilik om te skat uit waargeneemde data omdat dit nie moontlik is om versamelaars te identifiseer met slegs waargeneemde data nie (om te weet of iemand vergelykbaar is, moet jy waarneem of hy gedien het wanneer hy opgestel is en of hy gedien het wanneer hy nie opgestel is nie).

Dit blyk - ietwat verrassend - dat as daar enige verskaffers is, dan word daar drie addisionele aannames gemaak. Dit is moontlik om CACE van waargenome data te skat. Eerstens moet 'n mens aanvaar dat die opdrag vir behandeling lukraak is. In die geval van die konsep lotery is dit redelik. In sommige instellings waar natuurlike eksperimente nie op fisiese randomisering staatmaak nie, kan hierdie aanname meer problematies wees. Tweedens moet 'n mens aanvaar dat hulle geen uitdagers is nie (hierdie aanname word ook soms die monotoniese aanname genoem). In die konteks van die konsep lyk dit redelik om te aanvaar dat daar baie min mense is wat nie sal dien as hulle opgestel word nie en sal dien as hulle nie opgestel word nie. Derdens, en uiteindelik, kom die belangrikste aanname wat die uitsluitingbeperking genoem word. Onder die uitsluitingsbeperking moet 'n mens aanvaar dat al die effek van die behandelingsopdrag deur die behandeling self oorgedra word. Met ander woorde, 'n mens moet aanneem dat daar geen direkte effek van aanmoediging op uitkomste is nie. In die geval van die konsep lotery, byvoorbeeld, moet 'n mens aanvaar dat die konsepstatus geen effek het op ander verdienste as deur militêre diens nie (figuur 2.11). Die uitsluiting beperking kan geskend word indien byvoorbeeld mense wat opgestel is, meer tyd spandeer op skool om diens te vermy of indien werkgewers minder geneig is om mense wat opgestel is, te huur.

Figuur 2.11: Die uitsluiting beperking vereis dat die aanmoediging (konsep lotery) slegs 'n uitwerking op die uitkoms (verdienste) het as gevolg van die behandeling (militêre diens). Die uitsluiting beperking kan geskend word indien byvoorbeeld mense wat opgestel is, meer tyd in die skool spandeer het om diens te vermy en dat hierdie verhoogde tyd in die skool gelei het tot hoër verdienste.

Figuur 2.11: Die uitsluiting beperking vereis dat die aanmoediging (konsep lotery) slegs 'n uitwerking op die uitkoms (verdienste) het as gevolg van die behandeling (militêre diens). Die uitsluiting beperking kan geskend word indien byvoorbeeld mense wat opgestel is, meer tyd in die skool spandeer het om diens te vermy en dat hierdie verhoogde tyd in die skool gelei het tot hoër verdienste.

As hierdie drie voorwaarde (ewekansige opdrag tot behandeling, geen defiers en die uitsluitingbeperking) voldoen word nie, dan

\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]

sodat ons CACE kan skat:

\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]

Een manier om te dink aan CACE is dat dit die verskil in uitkomste is tussen diegene wat aangemoedig is en diegene wat nie aangemoedig is nie, opgeblaas deur die opname koers.

Daar is twee belangrike voorbeelde om in gedagte te hou. Eerstens is die uitsluitingbeperking 'n sterk aanname, en dit moet per geval geregverdig word, wat dikwels vakkundige kundigheid verg. Die uitsluiting beperking kan nie geregverdig word met die randomisering van die aanmoediging nie. Tweedens, 'n algemene praktiese uitdaging met instrumentele veranderlike analise kom wanneer die aanmoediging min invloed het op die opname van behandeling (wanneer \(\text{ITT}_W\) klein is). Dit word 'n swak instrument genoem , en dit lei tot 'n verskeidenheid probleme (Imbens and Rosenbaum 2005; Murray 2006) . Een manier om na te dink oor die probleem met swak instrumente is dat \(\widehat{\text{CACE}}\) \(\widehat{\text{ITT}_Y}\) oortredings van die uitsluitingbeperking - omdat hierdie vooroordeel vergroot word deur 'n klein \(\widehat{\text{ITT}_W}\) (sien \(\widehat{\text{ITT}_W}\) . 2.13). Ongeveer, as die behandeling wat die natuur toeskryf, nie 'n groot impak het op die behandeling waarvoor jy omgee nie, gaan jy moeilik leer oor die behandeling waarvoor jy omgee.

Sien hoofstukke 23 en 24 van Imbens and Rubin (2015) vir 'n meer formele weergawe van hierdie bespreking. Die tradisionele ekonometriese benadering tot instrumentele veranderlikes word tipies uitgedruk in die skatting van vergelykings, nie potensiële uitkomste nie. Vir 'n inleiding vanuit hierdie ander perspektief, sien Angrist and Pischke (2009) , en vir 'n vergelyking tussen die twee benaderings, sien afdeling 24.6 van Imbens and Rubin (2015) . 'N Alternatiewe, effens minder formele voorstelling van die instrumentale veranderlikes benadering word in hoofstuk 6 van Gerber and Green (2012) . Vir meer inligting oor die uitsluitingskorting, sien D. Jones (2015) . Aronow and Carnegie (2013) beskryf 'n addisionele stel aannames wat gebruik kan word om ATE eerder as CACE te skat. Vir meer inligting oor hoe natuurlike eksperimente baie moeilik kan wees om te interpreteer, sien Sekhon and Titiunik (2012) . Vir 'n meer algemene inleiding tot natuurlike eksperimente-een wat verder gaan as net die instrumentele veranderlikes benadering om ook ontwerpe soos regressie-diskontinuïteit in te sluit-sien Dunning (2012) .