Математичке белешке

У овом прилогу ћу резимирати неке идеје о извођењу узрочних закључака из неексперименталних података у нешто већој математичкој форми. Постоје два главна приступа: оквир узрочне грађе, најчешће повезан са Јудеа Пеарл и колегама, као и оквир потенцијалног исхода, који су највише повезани са Доналдом Рубином и колегама. Представићу оквир потенцијалног исхода јер је у блиској вези са идејама у математичким нотама на крају поглавља 3 и 4. За више у оквиру узрочних графикона препоручујем Pearl, Glymour, and Jewell (2016) (уводни ) и Pearl (2009) (напредни). За књиговодствени третман узрочног закључка који комбинује потенцијални оквир исхода и узрочни графички оквир, препоручујем Morgan and Winship (2014) .

Циљ овог додатка је да вам помогне да се постарате са нотацијом и стилом потенцијалне исходне традиције, тако да можете прелазити на неки од више техничких материјала написаних на ову тему. Прво ћу описати потенцијални оквир резултата. Онда ћу га користити да би даље разговарали о природним експериментима као што је Angrist (1990) о учинку војне службе на зараде. Овај додатак се у великој мери односи на Imbens and Rubin (2015) .

Оквир потенцијалних резултата

Оквир потенцијалног исхода има три главна елемента: јединице , третмане и потенцијалне исходе . Да бисмо илустровали ове елементе, размотримо стилизовану верзију питања упућеног у Angrist (1990) : Какав је утицај војне службе на зараде? У овом случају, можемо одредити јединице да буду људи који имају право на нацрт из 1970. године у Сједињеним Државама, и можемо их индексирати према \(i = 1, \ldots, N\) . Третмани у овом случају могу бити "служили у војсци" или "не служити у војсци". Ја ћу их назвати условима лијечења и контроле, а ја ћу написати \(W_i = 1\) ако особа \(i\) је у стању третмана и \(W_i = 0\) ако је особа \(i\) у контролном стању. Коначно, потенцијални исходи су мало концептуалније тешки, јер укључују "потенцијалне" исходе; ствари које су се могле догодити. За сваку особу која има право на нацрт из 1970. године, можемо замислити износ који би зарадили 1978. године ако су служили у војсци, што ћу назвати \(Y_i(1)\) , и износ који би они зарадили 1978 ако нису служили у војсци, што ћу назвати \(Y_i(0)\) . У оквиру потенцијалног исхода, \(Y_i(1)\) и \(Y_i(0)\) сматрају се фиксним количинама, док је \(W_i\) случајна варијабла.

Избор јединица, третмана и исхода је критичан јер дефинише шта се може научити и шта се не може научити из студије. Избор јединица - људи који имају право на нацрт из 1970. године - не укључују жене, и тако без додатних претпоставки, ова студија неће нам рећи ништа о учинку војног рока на жене. Од важности су и одлуке о томе како дефинирати третмане и исходе. На примјер, да ли би третирање интересовања било фокусирано на служење у војсци или борба? Да ли је исход камате зарада или задовољење посла? На крају, избор јединица, третмана и исхода треба водити научним и политичким циљевима студије.

Узимајући у обзир избор јединица, третмана и потенцијалних исхода, узрочни ефекат третмана на особу \(i\) , \(\tau_i\) , је

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]

Другим ријечима, упоређујемо колико особа \(i\) би зарађивала након што би служила колико особа \(i\) би зарадила без сервирања. За мене, ек. 2.1 је најјаснији начин да се дефинише узрочни ефекат, иако изузетно једноставан, овај оквир се испоставља генерализабилним на много важних и занимљивих начина (Imbens and Rubin 2015) .

Када користим оквир потенцијалног исхода, ја често сматрам да је корисно написати табелу која приказује потенцијалне исходе и ефекте третмана за све јединице (табела 2.5). Ако нисте у могућности да замислите такву таблицу за вашу студију, можда ћете морати бити прецизнији у вашим дефиницијама ваших јединица, третмана и потенцијалних исхода.

Табела 2.5: Табела потенцијалних исхода
Особа Зарада у стању третмана Зарада у контролном стању Ефекат лечења
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
Значити \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

Међутим, када дефинишемо узрочни ефекат на овај начин, налетимо на проблем. У скоро свим случајевима, не можемо посматрати и потенцијалне исходе. То јест, одређена особа је служила или није служила. Стога посматрамо један од потенцијалних исхода - \(Y_i(1)\) или \(Y_i(0)\) али не обоје. Немогућност посматрања и потенцијалних исхода је такав велики проблем који га је Holland (1986) назвао Основним проблемом узрочног закључивања .

На срећу, када истражујемо, немамо само једну особу; већ имамо пуно људи, а то нуди начин око основног проблема узрочног закључивања. Умјесто да покушамо процијенити ефекат третмана на појединачном нивоу, можемо процијенити просечан ефекат третмана за све јединице:

\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]

Ова једначина се и даље изражава у смислу \(\tau_i\) , које нису посматране, али са неким алгебром (ек 2.8 Gerber and Green (2012) ), добијамо

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]

Ово показује да ако можемо проценити просечан исход популације под лечењем ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) и просечан исход популације под контролом ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), онда можемо проценити просечан ефекат третмана, чак и без процене учинка третмана за било коју особу.

Сада када сам дефинисао процене - оно што желимо да проценимо - окренућу се како можемо да је проценимо са подацима. И овде се директно налазимо у проблему да само посматрамо један од потенцијалних исхода за сваку особу; видимо или \(Y_i(0)\) или \(Y_i(1)\) (табела 2.6). Можемо проценити просечан ефекат третмана упоређивањем зарада људи који су служили за зараду људи који нису служили:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]

где су \(N_t\) и \(N_c\) бројеви људи у условима лијечења и контроле. Овај приступ ће добро функционирати ако је задатак третмана независан од потенцијалних исхода, што се понекад назива и нефункционалност . Нажалост, у одсуству експеримента, неупотребљивост није често задовољена, што значи да је процењивач у једн. 2.4 није вероватно да ће произвести добру процену. Један начин размишљања о томе је да у одсуству случајног додељивања лечења, једн. 2.4 не упоређује као са сличним; Поредећи зараде различитих врста људи. Или изразито мало другачије, без случајног додељивања лечења, алокација третмана је вероватно повезана са потенцијалним исходима.

У 4. поглављу ћу описати како рандомизирани контролисани експерименти могу помоћи истраживачима да направе узрочне процјене, а овде ћу описати како истраживачи могу искористити природне експерименте, као што је нацрт лутрије.

Табела 2.6: Табела посматраних резултата
Особа Зарада у стању третмана Зарада у контролном стању Ефекат лечења
1 ? \(Y_1(0)\) ?
2 \(Y_2(1)\) ? ?
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) ? ?
Значити ? ? ?

Природни експерименти

Један приступ стварања узрочних процена без покретања експеримента је да потражите нешто што се дешава у свету које је случајно доделило третман за вас. Овај приступ се назива природним експериментима . У многим ситуацијама, нажалост, природа не случајно испоручује третман који желите заинтересованој популацији. Али понекад, природа насумично доноси повезан третман. Посебно ћу размотрити случај где постоји секундарни третман који подстиче људе да примају примарни третман . На пример, нацрт се може сматрати случајно додијељеним секундарним третманом који је охрабрио неке људе да примају примарни третман који је служио у војсци. Овај дизајн се понекад назива дизајном охрабрења . И метода анализе коју ћу описати како бих се суочила са овом ситуацијом понекад се зову инструментална варијабла . У овом окружењу, уз неке претпоставке, истраживачи могу користити охрабрење да сазнају о ефекту примарног третмана за одређени подскуп јединица.

Да бисмо се суочили са два различита третмана - охрабрење и примарни третман - потребно нам је нова нотација. Претпоставимо да су неки људи насумично нацртани ( \(Z_i = 1\) ) или нису нацртани ( \(Z_i = 0\) ); у овој ситуацији, \(Z_i\) понекад се зове инструмент .

Међу онима који су нацртани, неки су служили ( \(Z_i = 1, W_i = 1\) ), а неки нису ( \(Z_i = 1, W_i = 0\) ). Исто тако, међу онима који нису израђени, неки су служили ( \(Z_i = 0, W_i = 1\) ), а неки нису ( \(Z_i = 0, W_i = 0\) ). Потенцијални исходи за сваку особу могу се сада проширити како би показали свој статус и за охрабрење и за лечење. На пример, пустите \(Y(1, W_i(1))\) бити зарада особе \(i\) ако је нацртан, где је \(W_i(1)\) његов статус услуге ако је направљен. Даље, можемо поделити становништво у четири групе: компликовати, никада не примају, деферири и увек учесници (табела 2.7).

Табела 2.7: Четири врсте људи
Тип Сервис ако је направљен Служба ако није израђена
Цомплиерс Да, \(W_i(Z_i=1) = 1\) Не, \(W_i(Z_i=0) = 0\)
Никад не примају Не, \(W_i(Z_i=1) = 0\) Не, \(W_i(Z_i=0) = 0\)
Дефиерс Не, \(W_i(Z_i=1) = 0\) Да, \(W_i(Z_i=0) = 1\)
Увек добављачи Да, \(W_i(Z_i=1) = 1\) Да, \(W_i(Z_i=0) = 1\)

Пре него што разговарамо о процени утицаја третмана (тј. Војне службе), прво можемо дефинисати два ефекта охрабрења (тј. Бити израђен). Прво, можемо одредити ефекат охрабрења на примарну терапију. Друго, можемо одредити утицај охрабрења на исход. Испоставило се да се ова два ефекта могу комбиновати како би се процијенила утјецај лијечења на одређену групу људи.

Прво, ефекат охрабрења на третман може се дефинирати за особу \(i\) као

\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]

Надаље, ова количина се може дефинисати у целој популацији као

\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]

Коначно, можемо проценити \(\text{ITT} _{W}\) коришћењем података:

\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]

где је \(\bar{W}^{\text{obs}}_1\) опажена стопа третмана за оне који су подстакли и \(\bar{W}^{\text{obs}}_0\) је опажена стопа третмана за оне који нису били подстакнути. \(\text{ITT}_W\) такође се понекад назива и стопа \(\text{ITT}_W\) .

Затим, ефекат охрабрења на исход може бити дефинисан за особу \(i\) као:

\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]

Надаље, ова количина се може дефинисати у целој популацији као

\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]

Коначно, можемо проценити \(\text{ITT}_{Y}\) коришћењем података:

\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]

где је \(\bar{Y}^{\text{obs}}_1\) посматрани исход (нпр. зараде) за оне који су охрабрени (нпр. нацртани) и \(\bar{W}^{\text{obs}}_0\) је запажен исход за оне који нису охрабрени.

На крају, скренемо пажњу на ефекат интереса: ефекат примарног третмана (нпр. Војне службе) на исход (нпр. Зараде). Нажалост, испада да генерално не може оценити овај ефекат на све јединице. Међутим, са неким претпоставкама, истраживачи могу проценити утицај третмана на компликоване (тј. Људе који ће служити ако су израђени и људи који неће служити ако нису израђени, табела 2.7). Ја ћу звати ову процену компликованог просечног узрочног ефекта (ЦАЦЕ) (који се понекад назива и локални просјек ефеката лијечења , ЛАТЕ):

\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]

где \(G_i\) донира групу лица \(i\) (види табелу 2.7) и \(N_{\text{co}}\) је број сагласника. Другим речима, екв. 2.11 упоређује зараду сагласника који су нацртани \(Y_i(1, W_i(1))\) а не израђени \(Y_i(0, W_i(0))\) . Процене у једн. 2.11 изгледа тешко процијенити на основу посматраних података, јер није могуће идентифицирати компликанте користећи само посматране податке (да ли знате да ли је неко компликовао, требао би да приметите да ли је служио када је направљен и да ли је служио када није израђен).

Изгледа - донекле изненађујуће - да ако постоје неки компликатори, онда ако се дају три додатне претпоставке, могуће је процијенити ЦАЦЕ од посматраних података. Прво, треба претпоставити да је задатак на лечење случајан. У случају нацрта лутрије ово је разумно. Међутим, у неким околностима где се природни експерименти не ослањају на физичку рандомизацију, ова претпоставка може бити проблематична. Друго, морамо претпоставити да њихови губици нису дефекти (ова претпоставка се понекад назива претпоставком монотоности). У контексту нацрта, чини се разумно претпоставити да има врло мало људи који неће служити ако су израђени и служе ако нису израђени. Треће, и на крају, долази најважнија претпоставка која се зове ограничење искључења . Према ограничењу искључења, треба претпоставити да се све ефекте третмана третирају кроз сам третман. Другим речима, треба претпоставити да не постоји директан ефекат охрабрења на исходе. У случају нацрта лутрије, на примјер, треба претпоставити да нацрт статуса нема ефекта на зараду, осим кроз војну службу (слика 2.11). Ограничење изузећа могло би се нарушити ако, на примјер, људи који су израдени провели су више времена у школи како би избјегли службу или ако је мање вјероватно да послодавци ангажују људе који су израђени.

Слика 2.11: Ограничење искључења захтева да охрабрење (нацрт лутрије) има утицај на исход (зараде) само кроз третман (војни рок). Ограничење изузећа могло би бити повријеђено ако, на примјер, људи који су израђени провели су више времена у школи како би избјегли службу и да је ово повећано вријеме у школи довело до већих зарада.

Слика 2.11: Ограничење искључења захтева да охрабрење (нацрт лутрије) има утицај на исход (зараде) само кроз третман (војни рок). Ограничење изузећа могло би бити повријеђено ако, на примјер, људи који су израђени провели су више времена у школи како би избјегли службу и да је ово повећано вријеме у школи довело до већих зарада.

Ако су испуњена ова три стања (случајно додељење третману, без дефиера и ограничење искључења), онда

\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]

тако да можемо проценити ЦАЦЕ:

\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]

Један од начина размишљања о ЦАЦЕ-у јесте то што је разлика између оних који су охрабрени и оних који нису охрабрени, надувани стопом упада.

Постоје две важне опомене које треба имати на уму. Прво, ограничење искључења је снажна претпоставка, и она мора бити оправдана од случаја до случаја, која често захтева експертизу у области предмета. Ограничење искључења не може се оправдати случајном подстицањем. Друго, заједнички практични изазов са инструменталном варијабилном анализом долази када охрабрење мало утиче на узимање терапије (када је \(\text{ITT}_W\) мали). Ово се зове слаб инструмент , и доводи до разних проблема (Imbens and Rosenbaum 2005; Murray 2006) . Један од начина размишљања о проблему са слабим инструментима јесте да \(\widehat{\text{CACE}}\) може бити осетљив на мале пристрасности у \(\widehat{\text{ITT}_Y}\) -потенцијално због кршења ограничења искључења - јер се ове пристрасности повећавају малим \(\widehat{\text{ITT}_W}\) (види 2.13). Грубо, ако третман који приредјује природа нема велики утицај на третман који вам је стало, онда ћете имати тешкоће да сазнате о третману који вам је стало.

Погледајте поглавље 23 и 24 Imbens and Rubin (2015) за формалнију верзију ове дискусије. Традиционални економетријски приступ инструменталним варијаблама типично се изражава у смислу процјене једначина, а не потенцијалних исхода. За увод из ове друге перспективе, погледајте Angrist and Pischke (2009) , а за поређење између два приступа погледајте чланак 24.6 Imbens and Rubin (2015) . Алтернативно, нешто мање формално приказивање приступа инструменталним варијаблама дат је у поглављу 6 Gerber and Green (2012) . За више о ограничењу искључења погледајте D. Jones (2015) . Aronow and Carnegie (2013) описују додатни скуп претпоставки које се могу користити за процену АТЕ а не ЦАЦЕ. Више о томе како природни експерименти могу бити врло тешко тумачити, видети Sekhon and Titiunik (2012) . За општи увод у природне експерименте - онај који иде даље од инструменталног променљивог приступа такође укључује и дизајн као што је дисконтинуитет регресије - види Dunning (2012) .