Matematikaj notoj

En ĉi tiu apendico, mi resumos iujn ideojn pri kaŭzado de kaŭzaj konferencoj de ne-eksperimentaj datumoj en iomete pli matematika formo. Estas du ĉefaj alproksimiĝoj: la kazema grafika kadro, plej asociita kun Judea Pearl kaj kolegoj, kaj la potenca rezultita kadro, plej asociita kun Donald Rubin kaj kolegoj. Mi enmetos la eblajn rezultojn kadro ĉar ĝi estas pli proksime ligita al la ideoj en la matematikaj notoj fine de la ĉapitro 3 kaj 4. Por pli da pri la kazaj grafikaĵoj, mi rekomendas Pearl, Glymour, and Jewell (2016) (enkonduko ) kaj Pearl (2009) (progresinta). Por daŭra traktado de kaŭzaj konferencoj, kiu kombinas la potencajn rezultojn kaj la kazan kadron, mi rekomendas Morgan and Winship (2014) .

La celo de ĉi tiu apendico estas helpi vin komforti kun la notacio kaj stilo de la potenca rezultita tradicio por ke vi povas transiri al iu el la pli teknika materialo skribita sur ĉi tiu temo. Unue, mi priskribos la eblajn rezultojn kadro. Tiam, mi uzos ĝin por plu diskuti naturajn eksperimentojn kiel la de Angrist (1990) sur la efiko de militservo pri enspezoj. Ĉi tiu apendico altiras tre je Imbens and Rubin (2015) .

Potencaj rezultaj kadro

La potenca rezultita kadro havas tri ĉefajn elementojn: unuoj , traktadoj kaj potencaj rezultoj . Por ilustri ĉi tiujn elementojn, ni konsideru stiligitan version de la demando adresita en Angrist (1990) : Kio estas la efiko de militservo sur enspezoj? En ĉi tiu kazo ni povas difini la unuojn por esti homoj elekteblaj por la projekto de 1970 en Usono, kaj ni povas indeksi ĉi tiujn homojn per \(i = 1, \ldots, N\) . La traktadoj en ĉi tiu kazo povas esti "servantaj en militistoj" aŭ "ne servi en militistoj." Mi nomos ĉi tiujn la traktadon kaj kontrolkondiĉojn, kaj mi skribos \(W_i = 1\) se persono \(i\) estas en la traktado kaj \(W_i = 0\) se persono \(i\) estas en la kontrolkondiĉo. Finfine, la eblaj rezultoj iomete koncernas malfacile ĉar ili implicas "potencajn" rezultojn; aĵoj kiuj povus esti okazintaj. Por ĉiu persono elektebla por la projekto de 1970, ni povas imagi la sumon, kiun ili gajnus en 1978, se ili servis en militistoj, kiujn mi nomos \(Y_i(1)\) kaj la kvanton, kiun ili gajnus en 1978 se ili ne servis en militistoj, kiujn mi nomos \(Y_i(0)\) . En la eventuala kadro, \(Y_i(1)\) kaj \(Y_i(0)\) estas konsiderataj fiksaj kvantoj, dum \(W_i\) estas hazarda variablo.

La elekto de unuoj, traktadoj kaj rezultoj estas kritika ĉar ĝi difinas, kio povas-lerni de la studo. La elekto de unuoj-homoj elekteblaj por la projekto de 1970 - ne inkluzivas virinojn, kaj sekve sen suplementaj supozoj, ĉi tiu studo ne diros al ni ion pri la efiko de militservo pri virinoj. Decidoj pri kiel difini traktadojn kaj rezultojn ankaŭ gravas. Ekzemple, ĉu la traktado de intereso estu koncentrita en servado en la militista aŭ sperta batalo? Ĉu la rezulto de intereso estu enspezoj aŭ labora kontentigo? Finfine, la elekto de unuoj, traktadoj kaj rezultoj devas esti pelita de sciencaj kaj politikaj celoj de la studo.

Donita la elektojn de unuoj, traktadoj kaj potencaj rezultoj, la kaŭzo de la traktado sur persono \(i\) , \(\tau_i\) , estas

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]

Alivorte, ni komparas kiom da persono \(i\) estus gajninta post servado al kiom da persono \(i\) estus gajninta sen servado. Al mi, eq. 2.1 estas la plej klara maniero difini kaŭzan efikon, kaj kvankam tre simpla, ĉi tiu kadro rezultas ĝeneraligebla en multaj gravaj kaj interesaj manieroj (Imbens and Rubin 2015) .

Kiam mi uzas la eblajn rezultojn, mi ofte helpas skribi tablon montrante la eblajn rezultojn kaj la efikajn efikojn por ĉiuj unuoj (tablo 2.5). Se vi ne povas imagi tablon kiel ĉi tion por via studo, tiam vi eble bezonos esti pli preciza en viaj difinoj de viaj unuoj, traktadoj kaj eventualaj rezultoj.

Tablo 2.5: Tabelo de Potencaj rezultoj
Persono Enspezoj en traktado kondiĉo Enspezoj en kontrolo kondiĉo Efekto de traktado
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
Meza \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

Kiam ni difinas la kaŭzan efikon de ĉi tiu maniero, tamen ni fariĝas problemo. En preskaŭ ĉiuj kazoj, ni ne atingas observi ambaŭ potencajn rezultojn. Tio estas, specifa persono ankaŭ servis aŭ ne servis. Sekve, ni observas unu el la eblaj rezultoj - \(Y_i(1)\)\(Y_i(0)\) sed ne ambaŭ. La nekapablo observi ambaŭ potencajn rezultojn estas tia grava problemo, ke Holland (1986) nomis ĝin la Fundamenta Problemo de Kaŭza Inkludo .

Feliĉe, kiam ni esploras, ni ne nur havas unu personon; Prefere, ni havas multajn homojn, kaj ĉi tio proponas ĉirkaŭ la Fundamenta Problemo de Kaŭza Inferencia. Anstataŭ provi taksi la efikan traktan efikon, ni povas taksi la averaĝan traktadon por ĉiuj unuoj:

\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]

Ĉi tiu ekvacio ankoraŭ esprimas laŭ la \(\tau_i\) , kiuj estas neobserveblaj, sed kun iu algebro (eq 2.8 de Gerber and Green (2012) ), ni ricevas

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]

Ĉi tio montras, ke se ni povas taksi la popularan rezulton de la loĝantaro sub traktado ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) kaj la populara averaĝa rezulto sub kontrolo ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), tiam ni povas taksi la averaĝan efikan traktadon, eĉ sen estimi la traktan efikon por iu aparta persono.

Nun, ke mi difinis nian korinklinon - la aferon, kiun ni provas taksi - Mi turnos sin al kiel ni povas efektive taksi ĝin per datumoj. Kaj jen ni kuras rekte en la problemon, ke ni nur observas unu el la eblaj rezultoj por ĉiu persono; ni vidas aŭ \(Y_i(0)\)\(Y_i(1)\) (tablo 2.6). Ni povus taksi la mezuran traktan efikon komparante la enspezojn de homoj, kiuj servis al la enspezoj de homoj, kiuj ne servis:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]

kie \(N_t\) kaj \(N_c\) estas la nombroj da homoj en la traktado kaj kontrolo-kondiĉoj. Ĉi tiu aliro funkcios bone se la traktado fariĝas sendependa de eblaj rezultoj, kondiĉo iam nomata ignorebleco . Bedaŭrinde, en foresto de eksperimento, ignorebleco ne ofte kontentiĝas, kio signifas, ke la estimilo en eq. 2.4 Ne probable produktas bonan takson. Unu maniero por pensi pri tio estas, ke, en manko de hazarda faro de kuracado, eq. 2.4 ne komparas kiel kun similaj; ĝi komparas la gajnojn de malsamaj specoj de homoj. Aŭ esprimita iomete malsama, sen hazarda faro de traktado, la traktado-atribuo probable rilatas al potencaj rezultoj.

En ĉapitro 4 mi priskribos, kiel hazarde kontrolitaj eksperimentoj povas helpi al esploristoj fari kaŭzajn kalkulojn, kaj ĉi tie mi priskribos, kiel esploristoj povas utiligi naturajn eksperimentojn, kiel ekzemple la projekto de loterio.

Tablo 2.6: Tabelo de Observataj rezultoj
Persono Enspezoj en traktado kondiĉo Enspezoj en kontrolo kondiĉo Efekto de traktado
1 ? \(Y_1(0)\) ?
2 \(Y_2(1)\) ? ?
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) ? ?
Meza ? ? ?

Naturaj eksperimentoj

Unu aliro al fari kuraĝajn taksojn sen ekzercado estas serĉi ion okazantan en la mondo, kiu hazarde atribuis al vi traktadon. Ĉi tiu alproksimiĝo nomas naturaj eksperimentoj . En multaj situacioj, bedaŭrinde, naturo ne hazarde transdonas la traktadon, kiun vi volas al la populacio de intereso. Sed kelkfoje, naturo hazarde liveras rilatajn traktadon. En aparta, mi konsideros la kazon kie ekzistas ia malĉefa traktado, kiu instigas homojn ricevi la priman traktadon . Ekzemple, la projekto povus esti konsiderita hazarda asignita malĉefa traktado, kiu kuraĝigis iujn homojn preni la unuan kuracadon, kiu servis en la militistaro. Ĉi tiu dezajno foje nomiĝas kuraĝigo . Kaj la analitika metodo, kiun mi priskribos por pritrakti ĉi tiun situacion, foje estas nomata instrumentaj variabloj . En ĉi tiu opcio, kun iuj supozoj, esploristoj povas uzi la instigon por lerni pri la efiko de la primara traktado por aparta subaro de unuoj.

Por manipuli la du malsamajn traktadojn - la instigon kaj la priman traktadon - ni bezonas novan novan notacion. Supozu, ke iuj homoj estas hazarde redaktitaj ( \(Z_i = 1\) ) aŭ ne redaktitaj ( \(Z_i = 0\) ); En ĉi tiu situacio, \(Z_i\) estas iam nomata instrumento .

Inter tiuj, kiuj estis redaktitaj, iuj servis ( \(Z_i = 1, W_i = 1\) ) kaj iuj ne ( \(Z_i = 1, W_i = 0\) ). Same, inter tiuj, kiuj ne estis redaktitaj, iuj servis ( \(Z_i = 0, W_i = 1\) ) kaj iuj ne ( \(Z_i = 0, W_i = 0\) ). La potencaj rezultoj por ĉiu persono nun povas esti vastigitaj por montri sian staton por la instigo kaj la traktado. Ekzemple, lasu \(Y(1, W_i(1))\) esti la enspezoj de persono \(i\) se li estis redaktita, kie \(W_i(1)\) estas lia servo statuso se redaktita. Plie, ni povas disigi la populacion en kvar grupojn: laŭulojn, nekonatojn, defendantojn kaj ĉiamkaptantojn (tablo 2.7).

Tablo 2.7: Kvar Tipoj de Homoj
Tajpu Servo se redaktita Servo se ne redaktita
Laŭuloj Jes, \(W_i(Z_i=1) = 1\) Ne, \(W_i(Z_i=0) = 0\)
Neniam-taksantoj Ne, \(W_i(Z_i=1) = 0\) Ne, \(W_i(Z_i=0) = 0\)
Defiantoj Ne, \(W_i(Z_i=1) = 0\) Jes, \(W_i(Z_i=0) = 1\)
Ĉiam-portantoj Jes, \(W_i(Z_i=1) = 1\) Jes, \(W_i(Z_i=0) = 1\)

Antaŭ ol ni diskutas taksante la efikon de la traktado (tio estas, milita servo), ni unue povas difini du efikojn de la instigo (te redaktante). Unue, ni povas difini la efikon de la instigo pri la primara traktado. Due, ni povas difini la efikon de la instigo pri la rezulto. Ĝi rezultos, ke ĉi tiuj du efikoj povas esti kombinitaj por havigi takson de la efiko de la traktado sur specifa grupo de homoj.

Unue, la efiko de la instigo pri kuracado povas esti difinita por persono \(i\) kiel

\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]

Plie, ĉi tiu kvanto povas esti difinita super la tuta populacio kiel

\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]

Fine, ni povas taksi \(\text{ITT} _{W}\) uzante datumojn:

\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]

kie \(\bar{W}^{\text{obs}}_1\) estas la observita imposto de kuracilo por tiuj, kiuj estis kuraĝigitaj kaj \(\bar{W}^{\text{obs}}_0\) estas la observita imposto de kuracado por tiuj, kiuj ne estis kuraĝigitaj. \(\text{ITT}_W\) estas ankaŭ iam nomata la enspezo .

Poste, la efiko de la instigo ĉe la rezulto povas esti difinita por persono \(i\) kiel:

\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]

Plie, ĉi tiu kvanto povas esti difinita super la tuta populacio kiel

\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]

Fine, ni povas taksi \(\text{ITT}_{Y}\) uzante datumojn:

\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]

kie \(\bar{Y}^{\text{obs}}_1\) estas la observita rezulto (ekz. enspezoj) por tiuj, kiuj estis kuraĝigitaj (ekz., redaktitaj) kaj \(\bar{W}^{\text{obs}}_0\) estas la observita rezulto por tiuj, kiuj ne estis kuraĝigitaj.

Finfine ni atentas la efikon de intereso: la efikon de la primara traktado (ekz. Milita servo) pri la rezulto (ekz. Enspezoj). Bedaŭrinde, tio rezultas, ke ĝenerale ne povas taksi ĉi tiun efikon sur ĉiuj unuoj. Tamen, kun iuj supozoj, esploristoj povas taksi la efikon de la traktado al plenuloj (te homoj, kiuj servos se redaktitaj kaj homoj, kiuj ne servos se ne redaktitaj, tablo 2.7). Mi vokos ĉi tiun koncentriĝon de la plej plena averaĝa kaŭza efiko (CACE) (kiu ankaŭ estas iam nomata la loka averaĝa traktado efiko , LATE):

\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]

Kie \(G_i\) donacas la grupon de persono \(i\) (vidu tablo 2.7) kaj \(N_{\text{co}}\) estas la nombro da kontentuloj. Alivorte, eq. 2.11 komparas la enspezojn de plenuloj kiuj estas redaktitaj \(Y_i(1, W_i(1))\) kaj ne redaktitaj \(Y_i(0, W_i(0))\) . La korinklino en eq. 2.11 ŝajnas malfacile taksi de observataj datumoj ĉar ĝi ne eblas identigi kontentulojn uzante nur observitajn datumojn (por scii, se iu plenumas, vi bezonus observi ĉu li servis kiam li redaktis kaj ĉu li funkciis kiam ne redaktita).

Ĝi rezultas - iom surprize - ke se ekzistas iuj kontentuloj, tiam se oni faras tri kromajn supozojn, ĝi eblas taksi CACE de observitaj datumoj. Unue, oni devas supozi, ke la tasko al traktado estas hazarda. En la kazo de la draft loterio tio estas racia. Tamen, en iuj agordoj, kie naturaj eksperimentoj ne dependas de fizika aleatorigo, ĉi tiu supozo eble pli problemiĝas. Due oni devas supozi, ke ili ne estas defiantoj (ĉi tiu supozo estas ankaŭ iam nomata la monotoneca supozo). En la kunteksto de la projekto, ŝajnas esti racia supozi, ke ekzistas tre malmultaj homoj, kiuj ne servos, ĉu ili estas redaktitaj kaj servos se ili ne redaktas. Tria, kaj fine, venas la plej grava supozo, kiu estas nomata la forigo de limigo . Sub la forigo de limigo, oni devas supozi, ke la tuta efiko de la traktado fariĝas tra la traktado mem. Alivorte, oni devas supozi, ke ne ekzistas rekta efiko de instigo pri rezultoj. En la kazo de la projekto de loterio, ekzemple oni devas supozi, ke la statuso de la projekto ne efikas sur enspezoj krom milita servo (figuro 2.11). La limigo de forigo povus esti seksperfortita se, ekzemple, homoj, kiuj estis redaktitaj, pasigis pli da tempo en la lernejo por eviti servon aŭ se dungantoj malpli volis kontrakti homojn, kiuj estis redaktitaj.

Figuro 2.11: La forigo de limigo postulas, ke la kuraĝigo (loterio) efektivigas la rezulton (enspezoj) nur tra la traktado (militservo). La limigo de forigo povus esti seksperfortita se, ekzemple, homoj, kiuj estis redaktitaj, pasigis pli da tempo en la lernejo por eviti servon kaj ke ĉi tiu pliigita tempo en la lernejo kaŭzis pli altajn enspezojn.

Figuro 2.11: La forigo de limigo postulas, ke la kuraĝigo (loterio) efektivigas la rezulton (enspezoj) nur tra la traktado (militservo). La limigo de forigo povus esti seksperfortita se, ekzemple, homoj, kiuj estis redaktitaj, pasigis pli da tempo en la lernejo por eviti servon kaj ke ĉi tiu pliigita tempo en la lernejo kaŭzis pli altajn enspezojn.

Se ĉi tiuj tri kondiĉoj (hazarda faro al traktado, sen defiroj, kaj la forigo de limigo) estas renkontitaj, tiam

\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]

do ni povas taksi CACE:

\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]

Unu maniero por pensi pri CACE estas ke ĝi estas la diferenco de rezultoj inter tiuj, kiuj estis kuraĝigitaj kaj tiuj, kiuj ne kuraĝigis, ŝvelitaj de la akcepto.

Estas du gravaj kavernoj por atenti. Unue, la forigo de limigo estas forta supozo, kaj ĝi devas esti pravigita per kazoj, kiu ofte postulas sperton de subjekto. La forigo de forigo ne povas esti pravigita per hazardigo de la instigo. Due, komuna praktika defio kun instrumenta varia analitiko venas kiam la instigo havas malmultan efikon sur la konsumado de kuracado (kiam \(\text{ITT}_W\) estas malgranda). Ĉi tio nomas malforta instrumento , kaj ĝi kondukas al diversaj problemoj (Imbens and Rosenbaum 2005; Murray 2006) . Unu maniero por pensi pri la problemo kun malfortaj instrumentoj estas ke \(\widehat{\text{CACE}}\) povas esti sentema al malgrandaj parcialoj en \(\widehat{\text{ITT}_Y}\) -potence pro seksperfortadoj de la forigo de la forigo-ĉar ĉi tiuj paŝoj pliiĝas per malgranda \(\widehat{\text{ITT}_W}\) (vidu la kvadrataĵon 2.13). Iomete, se la traktado, kiun la naturo asignas, ne havas grandan efikon sur la kuracado, kiun vi zorgas, tiam vi malfacile lernos pri la traktado, kiun vi zorgas pri.

Vidu ĉapitron 23 kaj 24 de Imbens and Rubin (2015) por pli formala versio de ĉi tiu diskuto. La tradicia ekonometika aliro al instrumentaj variabloj estas kutime esprimita laŭ taksado de ekvacioj, ne eblaj rezultoj. Por enkonduko de ĉi tiu alia perspektivo, vidu Angrist and Pischke (2009) , kaj por komparo inter la du aliroj, vidu sekcion 24.6 de Imbens and Rubin (2015) . Alternativa, iom malpli formala prezento de la instrumenta variablokravaĵo estas provizita en ĉapitro 6 de Gerber and Green (2012) . Por pli da pri la forigo de limigo, vidu D. Jones (2015) . Aronow and Carnegie (2013) priskribas aldonan aron de supozoj, kiuj povas esti uzataj por taksi ATE anstataŭ CACE. Por pli da kiel naturaj eksperimentoj povas esti tre malfacilaj por interpreti, vidu Sekhon and Titiunik (2012) . Por pli ĝenerala enkonduko al naturaj eksperimentoj, unu, kiu preterpasas nur la instrumentan variablon, kiu ankaŭ inkluzivas dezajnojn kiel regresigan malkontinuecon - vidu Dunning (2012) .