Matematičke beleške

Ovaj prevod je kreiran od strane kompjutera. ×

Matematičke beleške

U ovom dodatku ću rezimirati neke ideje o izvođenju uzročnih zaključaka iz neeksperimentalnih podataka u nešto većoj matematičkoj formi. Postoje dva glavna pristupa: okvir uzročne građe, koji je najviše povezan sa Judea Pearl i kolegama, kao i okvir potencijalnih ishoda, koji su najviše povezani sa Donaldom Rubinom i kolegama. Predstaviću okvir potencijalnog ishoda jer je u bliskoj vezi sa idejama u matematičkim notama na kraju poglavlja 3 i 4. Za više u okviru uzročnih grafikona preporučujem Pearl, Glymour, and Jewell (2016) (uvodni ) i Pearl (2009) (napredni). Za dugotrajno tretiranje uzročnog zaključka koji kombinuje potencijalni okvir rezultata i okvir uzročnog grafika, preporučujem Morgan and Winship (2014) .

Cilj ovog dodatka je da vam pomogne da se postarate sa notacijom i stilom tradicije potencijalnog ishoda tako da možete prelaziti na neki od više tehničkih materijala napisanih na ovu temu. Prvo ću opisati potencijalni okvir rezultata. Onda ću ga koristiti kako bih dalje razgovarala o prirodnim eksperimentima kao što je Angrist (1990) o učinku vojne službe na zarade. Ovaj dodatak se u velikoj meri Imbens and Rubin (2015) na Imbens and Rubin (2015) .

Okvir potencijalnih rezultata

Okvir potencijalnog ishoda ima tri glavna elementa: jedinice , tretmane i potencijalne ishode . Da bismo ilustrovali ove elemente, razmotrimo stiliziranu verziju pitanja upućenog u Angrist (1990) : Kakav je uticaj vojne službe na zarade? U ovom slučaju možemo odrediti jedinice da budu ljudi koji imaju pravo na nacrt iz 1970. godine u Sjedinjenim Državama, i možemo ih indeksirati prema \(i = 1, \ldots, N\) . Tretmani u ovom slučaju mogu biti "služili u vojsci" ili "ne služiti u vojsci." Nazvaću te uslove tretmana i kontrole, a ja ću napisati \(W_i = 1\) ako osoba \(i\) je u stanju tretmana i \(W_i = 0\) ako je osoba \(i\) u kontrolnom stanju. Konačno, potencijalni ishodi su malo konceptualnije teški jer uključuju "potencijalne" ishode; stvari koje su se mogle dogoditi. Za svaku osobu koja ima pravo na nacrt iz 1970. godine, možemo zamisliti iznos koji bi zaradili 1978. godine ako su služili u vojsci, što ću nazvati \(Y_i(1)\) , i iznos koji bi oni zaradili 1978 ako nisu služili u vojsci, što ću nazvati \(Y_i(0)\) . U okviru potencijalnog ishoda, \(Y_i(1)\) i \(Y_i(0)\) smatraju se fiksnim količinama, dok je \(W_i\) slučajna varijabla.

Izbor jedinica, tretmana i ishoda je kritičan jer određuje šta se može i ne može naučiti iz studije. Izbor jedinica - ljudi koji imaju pravo na nacrt iz 1970. godine - ne uključuju žene, pa bez dodatnih pretpostavki, ova studija neće nam reći ništa o učinku vojnog roka na žene. Od važnosti su i odluke o tome kako definirati tretmane i ishode. Na primjer, da li bi tretiranje interesovanja bilo fokusirano na služenje u vojsci ili borbu u borbi? Da li je ishod od kamate zarada ili zadovoljenje posla? Na kraju, izbor jedinica, tretmana i ishoda treba voditi naučnim i političkim ciljevima studije.

S obzirom na izbor jedinica, tretmana i potencijalnih ishoda, uzročni efekat tretmana na osobu \(i\) , \(\tau_i\) , je

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]

Drugim riječima, upoređujemo koliko osoba \(i\) bi zarađivala nakon što bi služila koliko osoba \(i\) bi zaradila bez serviranja. Za mene, eq. 2.1 je najjasniji način da se definiše uzročni efekat, iako izuzetno jednostavan, ovaj okvir se ispostavlja generalizabilnim na mnogo važnih i zanimljivih načina (Imbens and Rubin 2015) .

Kada koristim okvir potencijalnog ishoda, često mi je korisno napisati tabelu koja prikazuje potencijalne ishode i efekte tretmana za sve jedinice (tabela 2.5). Ako niste u mogućnosti da zamislite ovakvu tablicu za vašu studiju, možda ćete morati biti precizniji u vašim definicijama vaših jedinica, tretmana i potencijalnih ishoda.

Tabela 2.5: Tabela potencijalnih ishoda
Osoba	Zarada u stanju tretmana	Zarada u kontrolnom stanju	Efekat lečenja
1	\(Y_1(1)\)	\(Y_1(0)\)	\(\tau_1\)
2	\(Y_2(1)\)	\(Y_2(0)\)	\(\tau_2\)
\(\vdots\)	\(\vdots\)	\(\vdots\)	\(\vdots\)
\(N\)	\(Y_N(1)\)	\(Y_N(0)\)	\(\tau_N\)
Srednje	\(\bar{Y}(1)\)	\(\bar{Y}(0)\)	\(\bar{\tau}\)

Međutim, kada definišemo uzročni efekat na ovaj način, naletimo na problem. U gotovo svim slučajevima, ne možemo posmatrati i potencijalne ishode. To jest, određena osoba je služila ili nije služila. Stoga posmatramo jedan od potencijalnih ishoda - \(Y_i(1)\) ili \(Y_i(0)\) ali ne oboje. Nemogućnost posmatranja i potencijalnih ishoda je takav veliki problem koji ga je Holland (1986) nazvao Osnovnim problemom uzročnog zaključivanja .

Na sreću, kada istražujemo, nemamo samo jednu osobu; već imamo puno ljudi, a to nudi način oko osnovnog problema uzročnog zaključivanja. Umjesto da pokušamo procijeniti efekat tretmana na pojedinačnom nivou, možemo procijeniti prosečan efekat tretmana za sve jedinice:

\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]

Ova jednačina se i dalje izražava u vidu \(\tau_i\) , koji se ne mogu posmatrati, ali sa nekim algebrom (eq 2.8 Gerber and Green (2012) ), dobijamo

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]

Ovo pokazuje da ako možemo proceniti prosečan ishod populacije pod lečenjem ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) i prosečan ishod populacije pod kontrolom ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), onda možemo proceniti prosečan efekat tretmana, čak i bez procene efekta tretmana za bilo koju osobu.

Sada kada sam definisao procene - ono što mi pokušavamo procijeniti - obratit ću se na to kako možemo stvarno procijeniti to sa podacima. I ovde direktno se bavimo problemom da posmatramo samo jedan od potencijalnih ishoda za svaku osobu; vidimo ili \(Y_i(0)\) ili \(Y_i(1)\) (tabela 2.6). Možemo proceniti prosečan efekat tretmana upoređivanjem zarada ljudi koji su služili za zaradu ljudi koji nisu služili:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]

gde su \(N_t\) i \(N_c\) brojevi ljudi u uslovima liječenja i kontrole. Ovaj pristup će dobro funkcionirati ako je tretmanski zadatak nezavisan od potencijalnih ishoda, što se ponekad naziva i nezapamljenost . Nažalost, u odsustvu eksperimenta, neupotrebljivost nije često zadovoljena, što znači da je procenjivač u jedn. 2.4 nije verovatno da će proizvesti dobru procenu. Jedan način razmišljanja o tome je da u odsustvu slučajnog dodeljivanja lečenja, jedn. 2.4 se ne upoređuje kao sa sličnim; upoređuju zaradu različitih vrsta ljudi. Ili izrazito malo drugačije, bez slučajnog dodeljivanja lečenja, alokacija tretmana je verovatno povezana sa potencijalnim ishodima.

U 4. poglavlju ću opisati kako randomizirani kontrolisani eksperimenti mogu pomoći istraživačima da naprave uzročne procjene, a ovde ću opisati kako istraživači mogu iskoristiti prirodne eksperimente, kao što je nacrt lutrije.

Tabela 2.6: Tabela posmatranih rezultata
Osoba	Zarada u stanju tretmana	Zarada u kontrolnom stanju	Efekat lečenja
1	?	\(Y_1(0)\)	?
2	\(Y_2(1)\)	?	?
\(\vdots\)	\(\vdots\)	\(\vdots\)	\(\vdots\)
\(N\)	\(Y_N(1)\)	?	?
Srednje	?	?	?

Prirodni eksperimenti

Jedan pristup stvaranju uzročnih procjena bez pokretanja eksperimenta jeste tražiti nešto što se dešava u svijetu koje je nasumično dodijelilo tretmanu za vas. Ovaj pristup se naziva prirodnim eksperimentima . U mnogim situacijama, nažalost, priroda ne slučajno isporučuje tretman koji želite zainteresovanoj populaciji. Ali ponekad, priroda nasumično donosi povezan tretman. Posebno ću razmotriti slučaj gde postoji sekundarni tretman koji podstiče ljude da primaju primarni tretman . Na primer, nacrt se može smatrati slučajno dodijeljenim sekundarnim tretmanom koji je ohrabrio neke ljude da primaju primarni tretman koji je služio u vojsci. Ovaj dizajn ponekad se naziva dizajnom ohrabrenja . Metoda analize koju ću opisati kako bih se suočila sa ovom situacijom ponekad se zovu instrumentalna varijabla . U ovom okruženju, uz neke pretpostavke, istraživači mogu koristiti ohrabrenje da saznaju o efektima primarnog tretmana za određeni podskup jedinica.

Kako bismo se suočili sa dva različita tretmana - ohrabrenje i primarni tretman - potrebno nam je nova notacija. Pretpostavimo da su neki ljudi nasumično nacrtani ( \(Z_i = 1\) ) ili nisu nacrtani ( \(Z_i = 0\) ); u ovoj situaciji, \(Z_i\) ponekad se zove instrument .

Među onima koji su nacrtani, neki su služili ( \(Z_i = 1, W_i = 1\) ) a neki nisu ( \(Z_i = 1, W_i = 0\) ). Isto tako, među onima koji nisu izrađeni, neki su služili ( \(Z_i = 0, W_i = 1\) ), a neki nisu ( \(Z_i = 0, W_i = 0\) ). Potencijalni ishodi za svaku osobu mogu se sada proširiti kako bi pokazali svoj status i za ohrabrenje i za lečenje. Na primjer, pustite \(Y(1, W_i(1))\) biti zaradu osobe \(i\) ako je nacrtan, gdje je \(W_i(1)\) njegov status usluge ako je napravljen. Dalje, možemo podeliti stanovništvo u četiri grupe: složivači, nikada ne uzimajući u obzir, deferiri i uvek uzimači (tabela 2.7).

Tabela 2.7: Četiri vrste ljudi
Tip	Servis ako je napravljen	Služba ako nije izrađena
Compliers	Da, \(W_i(Z_i=1) = 1\)	Ne, \(W_i(Z_i=0) = 0\)
Nikad ne uzimaju	Ne, \(W_i(Z_i=1) = 0\)	Ne, \(W_i(Z_i=0) = 0\)
Defiers	Ne, \(W_i(Z_i=1) = 0\)	Da, \(W_i(Z_i=0) = 1\)
Uvek dobavljači	Da, \(W_i(Z_i=1) = 1\)	Da, \(W_i(Z_i=0) = 1\)

Pre nego što razgovaramo o proceni uticaja tretmana (tj. Vojne službe), prvo možemo definisati dva efekta ohrabrenja (tj. Biti izrađen). Prvo, možemo definisati efekat ohrabrenja na primarnu terapiju. Drugo, možemo definisati uticaj ohrabrenja na ishod. Ispostavilo se da se ova dva efekta mogu kombinovati kako bi se procijenila utjecaj liječenja na određenu grupu ljudi.

Prvo, efekat ohrabrenja na tretman može se definirati za osobu \(i\) kao

\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]

Nadalje, ova količina se može definisati u celoj populaciji kao što je

\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]

Konačno, možemo proceniti \(\text{ITT} _{W}\) pomoću podataka:

\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]

gde je \(\bar{W}^{\text{obs}}_1\) opservirana brzina tretmana za one koji su ohrabreni i \(\bar{W}^{\text{obs}}_0\) je opažena stopa tretmana za one koji nisu bili podstaknuti. \(\text{ITT}_W\) takođe se ponekad naziva i stopa \(\text{ITT}_W\) .

Zatim, efekat ohrabrenja na ishod može se definirati za osobu \(i\) kao:

\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]

Nadalje, ova količina se može definisati u celoj populaciji kao što je

\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]

Konačno, možemo procijeniti \(\text{ITT}_{Y}\) pomoću podataka:

\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]

gdje je \(\bar{Y}^{\text{obs}}_1\) posmatrani ishod (npr. zarade) za one koji su ohrabreni (npr. nacrtani) i \(\bar{W}^{\text{obs}}_0\) je zapažen ishod za one koji nisu ohrabreni.

Konačno, skrenemo pažnju na efekat interesa: efekat primarnog tretmana (npr. Vojne službe) na ishod (npr. Zarade). Nažalost, ispada da generalno ne može procijeniti ovaj efekat na sve jedinice. Međutim, uz neke pretpostavke, istraživači mogu proceniti uticaj tretmana na komplikovane (tj. Ljude koji će služiti ako su izrađeni i ljudi koji neće služiti ako nisu izrađeni, tabela 2.7). Ja ću zvati ove procjene komplikovanog prosečnog uzročnog efekta (CACE) (koji se ponekad naziva i lokalni prosjek efekta liječenja , LATE):

\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]

gde \(G_i\) donira grupu osoba \(i\) (vidi tabelu 2.7) i \(N_{\text{co}}\) je broj saglasnika. Drugim rečima, eq. 2.11 upoređuje zaradu saglasnika koji su nacrtani \(Y_i(1, W_i(1))\) a ne izrađeni \(Y_i(0, W_i(0))\) . Procene u ekv. 2.11 izgleda teško procijeniti na osnovu posmatranih podataka, jer nije moguće identificirati komplikante korištenjem samo posmatranih podataka (da zna da li je neko komplikovao, trebao bi da primetite da li je služio kada je izrađen i da li je služio kada nije izrađen).

Izgleda - donekle iznenađujuće - da ako postoji bilo kakav komplikator, onda ako se daju tri dodatne pretpostavke, moguće je procijeniti CACE od posmatranih podataka. Prvo, treba pretpostaviti da je zadatak tretmana slučajan. U slučaju nacrta lutrije ovo je razumno. Međutim, u nekim okolnostima gde se prirodni eksperimenti ne oslanjaju na fizičku randomizaciju, ova pretpostavka može biti problematična. Drugo, moramo pretpostaviti da oni nisu deferensi (ova pretpostavka se ponekad naziva pretpostavkom monotonosti). U kontekstu nacrta, čini se razumno pretpostaviti da ima vrlo malo ljudi koji neće služiti ako su izrađeni i da će služiti ako ih ne izradi. Treće, i na kraju, dolazi najvažnija pretpostavka koja se naziva ograničenjem isključenja . Prema ograničenju isključenja, treba pretpostaviti da se sve efekte tretmana tretiraju kroz sam tretman. Drugim rečima, treba se pretpostaviti da ne postoji direktan efekat ohrabrenja na ishode. U slučaju nacrta lutrije, na primer, treba pretpostaviti da nacrt statusa nema efekta na zaradu, osim kroz vojnu službu (slika 2.11). Ograničenje izuzeća moglo bi biti povrijeđeno ako, na primjer, ljudi koji su izrađeni proveli su više vremena u školi kako bi izbjegli službu ili ako je manje vjerovatno da će poslodavci unajmiti ljude koji su izrađeni.

Slika 2.11: Ograničenje isključenja zahteva da ohrabrenje (nacrt lutrije) utiče na ishod (zarade) samo kroz tretman (vojni rok). Ograničenje isključenja može se narušiti ako, na primjer, ljudi koji su izradjeni proveli su više vremena u školi kako bi izbjegli službu i da je ovo povećano vrijeme u školi dovelo do većih zarada.

Ako su ispunjena ova tri stanja (slučajno dodeljenje tretmanu, bez defiera i ograničenje isključenja), onda

\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]

tako da možemo proceniti CACE:

\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]

Jedan od načina razmišljanja o CACE-u jeste to što je razlika između onih koji su podstaknuti i onih koji nisu ohrabreni, naduvan od stope upisivanja.

Postoje dve važne opomene koje treba imati u vidu. Prvo, ograničenje isključenja je snažna pretpostavka, i ona mora biti opravdana pojedinačno, što često zahteva ekspertizu u oblasti predmeta. Ograničenje isključenja ne može se opravdati sa randomizacijom ohrabrenja. Drugo, uobičajeni praktični izazov sa instrumentalnom varijabilnom analizom dolazi kada ohrabrenje malo utiče na uzimanje terapije (kada je \(\text{ITT}_W\) mala). Ovo se zove slab instrument , i dovodi do raznih problema (Imbens and Rosenbaum 2005; Murray 2006) . Jedan od načina razmišljanja o problemu sa slabim instrumentima jeste da \(\widehat{\text{CACE}}\) može biti osjetljiv na male pristrasnosti u \(\widehat{\text{ITT}_Y}\) -potencijalno zbog kršenja ograničenja isključenja - jer se ove pristrasnosti povećavaju malim \(\widehat{\text{ITT}_W}\) (vidi 2.13). Grubo rečeno, ako tretman koji dodjeljuje priroda ne utiče bitno na tretman koji vam je stalo, onda ćete imati teško vrijeme da saznate o tretmanu koji vam je stalo.

Pogledajte poglavlje 23 i 24 Imbens and Rubin (2015) za formalniju verziju ove diskusije. Tradicionalni ekonometrijski pristup instrumentalnim varijablama tipično se izražava u smislu procjene jednačina, a ne potencijalnih ishoda. Za uvod iz ove druge perspektive, pogledajte Angrist and Pischke (2009) , a za poređenje između dva pristupa pogledajte članak 24.6 Imbens and Rubin (2015) . Alternativno, nešto manje formalno predstavljanje pristupa instrumentalnim varijablama dat je u poglavlju 6 Gerber and Green (2012) . Za više o ograničenju isključenja pogledajte D. Jones (2015) . Aronow and Carnegie (2013) opisuju dodatni skup pretpostavki koje se mogu koristiti za procjenu ATE a ne CACE. Više o tome kako prirodni eksperimenti mogu biti vrlo teško tumačiti, videti Sekhon and Titiunik (2012) . Za opšti uvod u prirodne eksperimente - onaj koji prevazilazi samo instrumentalni varijabilni pristup koji uključuje i dizajn kao što je diskontinuitet regresije - vidi Dunning (2012) .