Matematické poznámky

V tomto dodatku budu shrnovat některé myšlenky o tom, že kauzální závěr z nepermanentních dat v trochu matematické formě. Existují dva hlavní přístupy: kauzální graf, nejvíce související s Judou Pearlem a kolegy, a potenciální výstupní rámec, nejvíce spojený s Donaldem Rubinem a kolegy. Představím rámec potenciálních výstupů, protože je více propojen s myšlenkami v matematických poznámkách na konci kapitoly 3 a 4. Další informace o rámci kauzálních grafů doporučuji Pearl, Glymour, and Jewell (2016) (úvodní ) a Pearl (2009) (pokročilé). Pro léčbu kauzálního závěru, který kombinuje potenciální výstupní rámec a kauzální graf, doporučuji Morgan and Winship (2014) .

Cílem tohoto dodatku je pomoci vám dosáhnout komfortu s notací a stylem tradice potenciálních výstupů, abyste mohli přejít na některé z technických materiálů napsaných na toto téma. Nejprve budu popsat potenciální výstupní rámec. Pak ji Angrist (1990) k dalšímu projednání přirozených experimentů, jako je ten, který Angrist (1990) o vlivu vojenské služby na výdělky. Tato příloha čerpá silně na Imbens and Rubin (2015) .

Potenciální výstupní rámec

Potenciální výstupní rámec má tři hlavní prvky: jednotky , léčby a potenciální výsledky . Abychom ilustrovali tyto prvky, pojďme se podívat na stylizovanou verzi otázky, kterou se zabývá Angrist (1990) : Jaký je účinek vojenské služby na výdělky? V tomto případě můžeme definovat jednotky jako osoby způsobilé pro návrh z roku 1970 ve Spojených státech a tyto osoby můžeme indexovat pomocí \(i = 1, \ldots, N\) . Léčba v tomto případě může být "sloužit v armádě" nebo "neslouží v armádě". Zavolám jim tyto léčebné a kontrolní podmínky a budu napsat \(W_i = 1\) jestliže osoba \(i\) je v podmínkách léčby a \(W_i = 0\) pokud je osoba \(i\) v kontrolním stavu. Konečně, potenciální výsledky jsou poněkud koncepčně obtížnější, protože zahrnují "potenciální" výsledky; věci, které se mohly stát. Pro každou osobu, která má nárok na návrh z roku 1970, si můžeme představit částku, kterou by v roce 1978 získali, kdyby sloužili v armádě, kterou budu nazývat \(Y_i(1)\) , a částku, kterou by získali 1978, pokud nesloužili v armádě, kterou budu nazývat \(Y_i(0)\) . V potenciálním \(Y_i(1)\) rámci jsou \(Y_i(1)\) a \(Y_i(0)\) považovány za fixní veličiny, zatímco \(W_i\) je náhodná proměnná.

Volba jednotek, léčby a výsledků je kritická, protože definuje, co se od studie může - a nemůže - naučit. Při výběru jednotek - osob způsobilých pro návrh z roku 1970 - nezahrnují ženy, a tak bez dalších předpokladů nám tato studie neřekne nic o účinku vojenské služby na ženy. Rozhodování o tom, jak definovat léčbu a výsledky, jsou také důležité. Například pokud by se zájmová léčba soustředila na sloučení v armádě nebo na boj? Máte-li výsledek zájmu zájem nebo pracovní spokojenost? V konečném důsledku by výběr jednotek, léčby a výsledků měl být řízen vědeckými a politickými cíli studie.

Vzhledem k výběru jednotek, léčby a potenciálních výsledků je kauzální účinek léčby na osobu \(i\) , \(\tau_i\) , je

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]

Jinými slovy, srovnáváme, kolik osob \(i\) by si získalo po tom, co jsme sloužili k tomu, kolik osob \(i\) by bylo dosaženo bez podání. Pro mě, eq. 2.1 je nejjasnější způsob, jak definovat kauzální efekt, a ačkoli je velmi jednoduchý, tento rámec se ukáže jako zobecňující v mnoha důležitých a zajímavých způsobech (Imbens and Rubin 2015) .

Pokud používám potenciální výstupní rámec, často považuji za užitečné napsat tabulku s potenciálními výsledky a účinky léčby pro všechny jednotky (tabulka 2.5). Pokud si nemůžete představit takovou tabulku pro svou studii, možná budete muset být přesnější ve svých definicích vašich jednotek, léčby a možných výsledcích.

Tabulka 2.5: Tabulka možných výsledků
Osoba Zisk ve zdravotním stavu Zisk ve stavu kontroly Účinky léčby
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
Znamenat \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

Při definování kauzálního účinku tímto způsobem však narazíme na problém. Ve většině případů se nedaří pozorovat oba možné výsledky. To znamená, že určitá osoba buď sloužila nebo nesloužila. Proto pozorujeme jeden z možných výsledků - \(Y_i(1)\) nebo \(Y_i(0)\) - ale ne obojí. Neschopnost pozorovat oba potenciální výsledky je tak závažným problémem, který Holland (1986) nazval základním problémem příčinné domněnky .

Naštěstí, když děláme výzkum, nemáme jen jednu osobu; spíše máme mnoho lidí a to nabízí cestu kolem základního problému příčinné domněnky. Namísto pokusu o odhad individuálního léčebného efektu lze odhadnout průměrný účinek léčby pro všechny jednotky:

\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]

Tato rovnice je stále vyjádřena v podmínkách \(\tau_i\) , které jsou nepozorovatelné, ale s nějakou algebrou (eq 2.8 Gerber and Green (2012) ) získáváme

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]

To ukazuje, že pro odhad průměru populace výsledek, který je léčen ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) a populace průměrný výsledek pod kontrolou ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), pak můžeme odhadnout průměrný účinek léčby i bez odhadu léčebného účinku pro kteroukoli jednotlivou osobu.

Nyní, když jsem definoval náš odhad - věc, kterou se snažíme odhadnout - se obrátím na to, jak to můžeme s údaji skutečně odhadnout. A tady se dostáváme přímo do problému, že pozorujeme pouze jeden z možných výsledků pro každou osobu; vidíme buď \(Y_i(0)\) nebo \(Y_i(1)\) (tabulka 2.6). Mohli bychom odhadnout průměrný účinek léčby srovnáním příjmů lidí, kteří sloužili k příjmům lidí, kteří nepodléhali:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]

kde \(N_t\) a \(N_c\) jsou počty lidí v podmínkách léčby a kontroly. Tento přístup bude fungovat dobře, pokud je přidělení léčby nezávislé na potenciálních výsledcích, což je stav, který se někdy označuje jako ignorabilita . Bohužel, při neexistenci experimentu, ignorovatelnost není často splněna, což znamená, že odhad v ekv. 2.4 není pravděpodobné, že vytvoří dobrý odhad. Jeden způsob, jak přemýšlet o tom, je, že při absenci náhodného přiřazení léčby, např. 2.4 není srovnáván s podobnými; porovnává příjmy různých druhů lidí. Nebo se vyjádřila mírně odlišná, bez náhodného přiřazení léčby, přidělení léčby pravděpodobně souvisí s potenciálními výsledky.

V kapitole 4 budu popisovat, jak mohou randomizované řízené experimenty pomoci výzkumníkům provést kauzální odhady, a zde budu popisovat, jak mohou výzkumníci využít přírodních experimentů, jako je návrh loterie.

Tabulka 2.6: Tabulka pozorovaných výsledků
Osoba Zisk ve zdravotním stavu Zisk ve stavu kontroly Účinky léčby
1 ? \(Y_1(0)\) ?
2 \(Y_2(1)\) ? ?
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) ? ?
Znamenat ? ? ?

Přírodní experimenty

Jeden přístup k vytváření kauzálních odhadů bez provedení experimentu je hledat něco, co se děje ve světě, který vám náhodně přidělil léčbu. Tento přístup se nazývá přirozené experimenty . V mnoha situacích, bohužel, příroda náhodně neposkytuje léčbu, kterou chcete, na obyvatelstvo, které vás zajímá. Někdy však příroda náhodně přináší související léčbu. Zvláště se budu zabývat případem, kdy existuje nějaká sekundární léčba, která povzbuzuje lidi k primární léčbě . Například návrh by mohl být považován za náhodně přiřazenou sekundární léčbu, která povzbudila některé lidi k primární léčbě, která sloužila v armádě. Tento design je někdy nazýván povzbuzením . A metoda analýzy, kterou budu popisovat, abych tuto situaci zvládla, je někdy nazývána nástrojovými proměnnými . V tomto nastavení, s některými předpoklady, výzkumníci mohou využít povzbuzení, aby se dozvěděli o účinku primární léčby pro určitou podskupinu jednotek.

Abychom zvládli dvě různé léčby - povzbuzení a primární léčbu - potřebujeme nějakou novou notaci. Předpokládejme, že někteří lidé jsou náhodně navrženi ( \(Z_i = 1\) ) nebo nejsou navrženi ( \(Z_i = 0\) ); v této situaci je \(Z_i\) někdy nazýván nástrojem .

Z těch, kteří byli navrženi, někteří sloužili ( \(Z_i = 1, W_i = 1\) ) a někteří nebyli ( \(Z_i = 1, W_i = 0\) ). Stejně tak mezi ti, kteří nebyli navrženi, někteří sloužili ( \(Z_i = 0, W_i = 1\) ) a někteří ne ( \(Z_i = 0, W_i = 0\) ). Potenciální výsledky pro každou osobu lze nyní rozšířit, aby ukázaly svůj status jak pro povzbuzení, tak pro léčbu. Například nechť \(Y(1, W_i(1))\) být výdělek člověka \(i\) pokud byl navržen, kde \(W_i(1)\) je jeho stav služby, pokud je navržen. Dále můžeme rozdělit populaci do čtyř skupin: komplienti, nevědomí, deferéři a vždy-příjemci (tabulka 2.7).

Tabulka 2.7: Čtyři typy lidí
Typ Služba je-li navržena Služba, pokud není navržena
Compliers Ano, \(W_i(Z_i=1) = 1\) Ne, \(W_i(Z_i=0) = 0\)
Nikdo ne Ne, \(W_i(Z_i=1) = 0\) Ne, \(W_i(Z_i=0) = 0\)
Defiery Ne, \(W_i(Z_i=1) = 0\) Ano, \(W_i(Z_i=0) = 1\)
Vždycky Ano, \(W_i(Z_i=1) = 1\) Ano, \(W_i(Z_i=0) = 1\)

Předtím, než budeme diskutovat o odhadu účinku léčby (tj. Vojenské služby), můžeme nejprve definovat dva účinky podpory (tj. Navrhované). Za prvé, můžeme definovat vliv podpory na primární léčbu. Za druhé, můžeme definovat vliv podpory na výsledek. Ukáže se, že tyto dva účinky lze kombinovat, aby poskytly odhad účinku léčby na určitou skupinu lidí.

Za prvé, účinek podpory na léčbu lze definovat pro osobu \(i\) as

\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]

Dále může být toto množství definováno na celé populaci jako

\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]

Nakonec můžeme odhadovat \(\text{ITT} _{W}\) pomocí dat:

\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]

kde \(\bar{W}^{\text{obs}}_1\) je pozorovaná rychlost léčby pro ty, kteří byli povzbuzeni a \(\bar{W}^{\text{obs}}_0\) pozorovanou míru léčby pro ty, kteří nebyli povzbuzeni. \(\text{ITT}_W\) se také někdy nazývá míra přijetí .

Dále může být účinek povzbuzení k výsledku definován pro osobu \(i\) jako:

\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]

Dále může být toto množství definováno na celé populaci jako

\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]

Nakonec můžeme odhadovat \(\text{ITT}_{Y}\) pomocí dat:

\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]

kde \(\bar{Y}^{\text{obs}}_1\) je pozorovaný výsledek (např zisk) pro ty, kteří byli vyzváni (např odveden) a \(\bar{W}^{\text{obs}}_0\) je pozorovaný výsledek pro ty, kteří nebyli povzbuzeni.

Na závěr upozorňujeme na účinek zájmu: vliv primární léčby (např. Vojenské služby) na výsledek (např. Výdělky). Bohužel se ukazuje, že obecně nelze odhadnout tento účinek na všechny jednotky. Nicméně, s některými předpoklady, mohou vědci odhadnout účinek léčby na komplicy (tj. Lidé, kteří budou sloužit, pokud budou zpracováni, a lidé, kteří nebudou sloužit, pokud nejsou vypracováni, tabulka 2.7). Říkám to odhad a průměrný kauzální efekt (CACE) (který se někdy nazývá také lokální průměrný léčebný účinek , LATE):

\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]

kde \(G_i\) daruje skupinu osob \(i\) (viz tabulka 2.7) a \(N_{\text{co}}\) je počet kompilátorů. Jinými slovy, ekv. 2.11 porovnává příjmy kompilátorů, kteří jsou zpracováni \(Y_i(1, W_i(1))\) a nejsou propracovány \(Y_i(0, W_i(0))\) . Odhad v ekv. 2.11 je těžké odhadnout z pozorovaných dat, protože není možné identifikovat komplicy pouze za použití pozorovaných údajů (vědět, jestli je někdo kompilátorem, je třeba si uvědomit, zda sloužil při sestavování a zda sloužil, když nebyl navržen).

Ukázalo se - poněkud překvapivě -, že pokud existují nějaké komplicy, pak za předpokladu, že se vytvoří tři dodatečné předpoklady, je možné odhadnout CACE z pozorovaných dat. Nejprve je třeba předpokládat, že zařazení do léčby je náhodné. V případě návrhu loterie je to rozumné. Nicméně v některých situacích, kdy se přirozené experimenty nespoléhají na fyzickou randomizaci, může být tento předpoklad mnohem problematický. Za druhé, je třeba předpokládat, že nejsou jejich deferéry (tento předpoklad se někdy nazývá také předpoklad monotonie). V kontextu návrhu se zdá rozumné předpokládat, že existuje jen velmi málo lidí, kteří nebudou sloužit, pokud budou navrženi a budou sloužit, pokud nebudou vypracováni. Za třetí, a konečně, přichází nejdůležitější předpoklad, který se nazývá omezení vyloučení . Podle omezení vyloučení je třeba předpokládat, že veškerý účinek přiřazení léčby prochází samotnou léčbou. Jinými slovy, je třeba předpokládat, že neexistuje žádný přímý účinek podpory na výsledky. Například v případě návrhu loterie je třeba předpokládat, že stav návrhu nemá vliv na výdělky jiné než prostřednictvím vojenské služby (obrázek 2.11). Omezení vyloučení by mohlo být narušeno, například když lidé, kteří byli navrženi, strávili více času ve škole, aby se vyhnuli službě, nebo pokud by zaměstnavatelé měli menší pravděpodobnost, že budou zaměstnávat navrhované osoby.

Obrázek 2.11: Omezení vyloučení vyžaduje, aby povzbuzení (návrh loterie) ovlivnilo výsledek (výdělky) pouze prostřednictvím léčby (vojenské služby). Omezení vyloučení by mohlo být porušeno, jestliže například navrhovaní lidé strávili více času ve škole, aby se vyhnuli službě, a že tento zvýšený čas ve škole vedl k vyšším příjmům.

Obrázek 2.11: Omezení vyloučení vyžaduje, aby povzbuzení (návrh loterie) ovlivnilo výsledek (výdělky) pouze prostřednictvím léčby (vojenské služby). Omezení vyloučení by mohlo být porušeno, jestliže například navrhovaní lidé strávili více času ve škole, aby se vyhnuli službě, a že tento zvýšený čas ve škole vedl k vyšším příjmům.

Pokud jsou splněny tyto tři podmínky (náhodné zařazení do léčby, žádné deferéry a omezení vyloučení)

\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]

takže můžeme odhadnout CACE:

\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]

Jedním ze způsobů, jak přemýšlet o CACE, je, že je to rozdíl ve výsledcích mezi těmi, kteří byli povzbuzeni, a ti, kteří nebyli povzbuzováni, naplněni mírou vychytávání.

Existují dvě důležité upozornění, které je třeba mít na paměti. Za prvé, omezení vyloučení je silným předpokladem a musí být odůvodněno případ od případu, což často vyžaduje odborné znalosti z oblasti. Omezení vyloučení nemůže být odůvodněno náhodným výběrem povzbuzení. Za druhé, společná praktická výzva s instrumentální variabilní analýzou přichází, když povzbuzení má malý vliv na přijetí léčby (když \(\text{ITT}_W\) je malá). To se nazývá slabý nástroj a vede k řadě problémů (Imbens and Rosenbaum 2005; Murray 2006) . Jeden způsob, jak přemýšlet o problému se slabými nástroji, je, že \(\widehat{\text{CACE}}\) může být citlivý na malé předsudky v \(\widehat{\text{ITT}_Y}\) porušování omezení vyloučení - protože tyto předsudky jsou zvětšeny malým \(\widehat{\text{ITT}_W}\) (viz rovnice 2.13). Zhruba, pokud léčba, kterou příroda přiděluje, nemá velký vliv na léčbu, na které vám záleží, pak se budete muset těžko seznámit s léčbou, na které vám záleží.

Viz kapitola 23 a 24 z Imbens and Rubin (2015) o formálnější verzi této diskuse. Tradiční ekonometrický přístup k instrumentálním proměnným je typicky vyjádřen pomocí odhadu rovnic, nikoli potenciálních výsledků. Pro úvod z této jiné perspektivy viz Angrist and Pischke (2009) a pro srovnání obou přístupů viz část 24.6 Imbens and Rubin (2015) . Alternativní, mírně méně formální prezentace přístupu instrumentálních proměnných je uvedena v kapitole 6 Gerber and Green (2012) . Další informace o omezení vyloučení viz D. Jones (2015) . Aronow and Carnegie (2013) popisují další soubor předpokladů, které lze použít k odhadu ATE spíše než CACE. Více o tom, jak mohou být přírodní experimenty velmi obtížné interpretovat, viz Sekhon and Titiunik (2012) . Pro obecnější úvod do přirozených experimentů, který přesahuje pouze přístup instrumentální proměnné, zahrnuje také návrhy, jako je regresní diskontinuita - viz Dunning (2012) .