Математикалық жазбалар

Бұл аударма компьютерде құрылды. ×

Математикалық жазбалар

Осы қосымшада мен эксперименттік емес деректерден сәл астам математикалық түрде нысаналы нәтиже шығару туралы кейбір ойларды қорытындылаймын. Екі негізгі көзқарас бар: негізінен Джудея Перл және әріптестерімен байланысты себепкерлік графикалық құрылым және Дональд Рубин мен әріптестерімен байланыстырылған ықтимал нәтиже негіздері. Мен 3-ші және 4-ші тараудың соңында математикалық ноталардағы идеялармен тығыз байланысты болғандықтан, әлеуетті нәтиже құрылымын енгізетін боламын. Себептердің негіздері туралы көбірек білу үшін Мен Pearl, Glymour, and Jewell (2016) (introductory ) және Pearl (2009) (жетілдірілген). Потенциалды нәтиже негізін және себеп-схема негіздерін біріктіретін себеп-салдарлық нәтижеге қол жеткізу үшін, мен Morgan and Winship (2014) ұсынамын.

Осы қосымшаның мақсаты - осы тақырыпта жазылған кейбір техникалық материалдарға көшу үшін әлеуетті нәтиже дәстүрінің белгілерімен және стилімен ыңғайлы болуыңызға көмектесу. Біріншіден, әлеуетті нәтиже құрылымын сипаттаймын. Содан кейін, оны Angrist (1990) әскери қызметтің пайдасына әсер етуі сияқты табиғи эксперименттерді талқылау үшін Angrist (1990) . Бұл қосымша Imbens and Rubin (2015) үлкен көңіл бөледі.

Әлеуетті нәтижелер негіздері

Потенциалды нәтижелердің негіздері үш негізгі элементтерден тұрады: бірлік , емдеу және ықтимал нәтиже . Бұл элементтерді суреттеу үшін, Angrist (1990) та Angrist (1990) сұрақтың стильдендірілген нұсқасын қарастырайық Angrist (1990) : Әскери қызметтің табысқа қалай әсер етеді? Бұл жағдайда, біз Құрама Штаттардағы 1970 жылғы жобаға сәйкес келетін адамдар бола алатын бөліктерді анықтай аламыз және біз оларды $i = 1, \ldots, N$ арқылы индекстей аламыз. Бұл жағдайда емдеу «әскери қызметте болуға» немесе «әскери қызметте емес» болуы мүмкін. Мен оларды емдеу мен бақылау шарттарын $W_i = 1$ боламын, және егер $i$ $W_i = 1$ $i$ емдеу жағдайында және $i$ басқару күйінде болса $W_i = 0$ . Ақыр соңында, әлеуетті нәтижелер әлдеқайда тұжырымдамалық қиын, өйткені олар «әлеуетті» нәтижелерді қамтиды; болуы мүмкін болатын нәрселер. 1970 жылғы жобаға сәйкес келетін әрбір адам үшін, егер олар 1978 жылы әскери қызметте қызмет етсе, мен $Y_i(1)$ деп есептейтін соманы және олардың алатын сомасын елестете аламыз 1978, егер олар әскерде қызмет етпесе, мен олар деп атаймын $Y_i(0)$ . Ықтимал нәтиже құрылымында $Y_i(1)$ және $Y_i(0)$ тіркелген шамалар саналады, ал $W_i$ кездейсоқ айнымалы болып табылады.

Бірліктерді таңдау, емдеу және нәтиже алу өте маңызды, себебі ол зерттеуден үйрену мүмкін емес және анықталмайды. 1970 жылғы жобаға сәйкес келетін бірліктерді таңдау - әйелдерді қамтымайды, сондықтан қосымша жол бермей, бұл зерттеу әйелдерге әскери қызметтің әсері туралы ештеңе айтпайды. Емдеу мен нәтижелерді қалай анықтау керектігі туралы шешімдер маңызды. Мысалы, қызығушылықты қарау әскери қызмет көрсетуде немесе жауынгерлік әрекетке баса назар аудару керек пе? Қызығушылықтың нәтижесі пайда табу немесе жұмысқа қанағаттандыру керек пе? Сайып келгенде, бөлімдерді таңдау, емдеу және нәтижелерді зерттеудің ғылыми және саяси мақсаттарына негізделуі керек.

Бірліктердің, емдеудің және ықтимал нәтиженің таңдауын ескере отырып, емдеудің адамға $i$ , $\tau_i$

$\tau_i = Y_i(1) - Y_i(0) \qquad(2.1)$

Басқаша айтқанда, біз қанша адам салыстыру $i$ қанша адам қызмет ететін кейін тапқан еді $i$ қызмет көрсететін жоқ тапқан еді. Мен үшін, экв. 2.1 - себепші әсерді анықтаудың ең айқын жолы және өте қарапайым болса да, бұл жүйе көптеген маңызды және қызықты жолдарда жалпыланатын болады (Imbens and Rubin 2015) .

Потенциалды нәтиже шеңберін пайдаланған кезде, барлық бөлімшелер үшін ықтимал нәтиже мен емдеу әсерін көрсететін кестені жазу жиі пайдалы (кесте 2.5). Егер сіздің зерттеуіңізге ұқсас кестені елестете алмасаңыз, онда сіз сіздің бөлімшелеріңіздегі анықтамаларыңызда, емдеулеріңізде және әлеуетті нәтижелеріңізде дәлірек болуы қажет болуы мүмкін.

Кесте 2.5: Әлеуетті нәтижелер кестесі
Адам	Емдеу жағдайында пайда	Басқару жағдайындағы кірістер	Емдеу әсері
1	$Y_1(1)$	$Y_1(0)$	$\tau_1$
2	$Y_2(1)$	$Y_2(0)$	$\tau_2$
$\vdots$	$\vdots$	$\vdots$	$\vdots$
$N$	$Y_N(1)$	$Y_N(0)$	$\tau_N$
Орташа мәні	$\bar{Y}(1)$	$\bar{Y}(0)$	$\bar{\tau}$

Осындай жолмен себеп-салдардың әсерін анықтағанда, біз проблемаға кезігеміз. Барлық дерлік жағдайларда біз әлеуетті нәтижелерге де назар аудармаймыз. Яғни белгілі бір адам қызмет еткен немесе қызмет ете алмаған. Сондықтан, ықтимал нәтижелердің біреуін байқаймыз: $Y_i(1)$ немесе $Y_i(0)$ екеуінің екеуі де емес. Әлеуетті нәтижелерді сақтау мүмкін еместігі де Holland (1986) оны себепкерден шығарудың іргелі мәселесі деп атаған маңызды мәселе.

Бақытымызға орай, зерттеу жүргізген кезде, бізде тек бір адам жоқ; Керісінше, бізде көптеген адамдар бар, және бұл мәселені шешудің іргелі мәселесіне айналады. Жеке дара емдеу тиімділігін бағалауға тырысудың орнына, барлық бірліктердің орташа емдеу әсерін бағалауға болады:

$\text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)$

Бұл теңдеу бұрынғысынша бақыланбайтын, бірақ кейбір алгебра ( Gerber and Green (2012) 2.8 $\tau_i$

$\text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)$

(Бұл біз емдеу бойынша халық орташа нәтижесін бағалай алады, егер көрсеткендей $N^{-1} \sum_{i=1}^N Y_i(1)$ ) және бақылауында халық орташа нәтижесін ( $N^{-1} \sum_{i=1}^N Y_i(1)$ ), онда кез-келген адам үшін емдеу әсерін бағалаусыз, тіпті орташа емдеу әсерін бағалауға болады.

Енді біз өзіміздің бағалауымызды - бағалауға тырысатын нәрсені анықтадық - мен оны нақты деректермен қалай бағалай аламыз деген сөзге кезігемін. Мұнда біз әр адамға арналған әлеуетті нәтижелердің біреуін ғана байқайтын мәселеге тікелей жүгіне аламыз; біз $Y_i(0)$ немесе $Y_i(1)$ (кесте 2.6). Біз емделмеген адамдардың пайдасына қызмет көрсететін адамдардың табысын салыстыру арқылы орташа емдеу әсерін бағалай аламыз:

$\widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)$

мұнда $N_t$ және $N_c$ емдеу және бақылау жағдайындағы адамдардың саны болып табылады. Бұл әдіс емдеу тапсырмасының әлеуетті нәтижеге тәуелді болмаған жағдайда жақсы жұмыс істейтіндіктен, кейде кейде елеусіздік деп аталады. Өкінішке орай, эксперимент болмаған жағдайда, назардан тыс қалмау жиі кездеседі, бұл дегеніміз, бағалаушы эг. 2.4 жақсы бағалауды жасамайды. Бұл туралы ойланудың бір жолы - емдеуді кездейсоқ тағайындау болмаған кезде, 2.4 ұқсас емес сияқты; ол әртүрлі адамдардың табысын салыстырады. Немесе емдеудің кездейсоқ тағайындалусыз біршама ерекшеленді, емделуді бөлу әлеуетті нәтижелерге байланысты.

4-тарауда зерттеушілерге себеп-салдарлық бағалауды жасауға рандомизацияланған бақыланатын эксперименттер қалай көмектесетінін сипаттайтын боламын. Мұнда зерттеушілердің лотерея жобалары сияқты табиғи эксперименттерді қалай пайдалана алатындығын сипаттаймын.

Кесте 2.6: бақыланатын нәтижелер кестесі
Адам	Емдеу жағдайында пайда	Басқару жағдайындағы кірістер	Емдеу әсері
1	?	$Y_1(0)$	?
2	$Y_2(1)$	?	?
$\vdots$	$\vdots$	$\vdots$	$\vdots$
$N$	$Y_N(1)$	?	?
Орташа мәні	?	?	?

Табиғи эксперименттер

Эксперимент жүргізбей, себеп-салдарын бағалаудың бір жолы - бұл сіз үшін емдеуді кездейсоқ тағайындаған әлемде орын алатын нәрсені іздеу. Бұл тәсіл табиғи эксперименттер деп аталады. Көптеген жағдайларда, өкінішке орай, табиғат қызығушылық танытқан тұрғындарға қажет емдеуді кездейсоқ жеткізбейді. Бірақ кейде табиғат кейде кездейсоқ емделеді. Атап айтқанда, адамдарға алғашқы ем алуға көмектесетін қайталама емдеу бар жағдайды қарастырамын. Мысалы, жобаны кездейсоқ тағайындалған қайталама емдеу деп санауға болады, ол кейбір адамдарға әскери қызметтегі алғашқы емделуге шақырды. Бұл дизайн кейде ынталандыру дизайны деп аталады. Бұл жағдайды шешу үшін сипаттайтын талдау әдісі кейде аспаптық ауыспалы деп аталады. Бұл жағдайда белгілі бір жорамалдармен зерттеушілер бірліктердің белгілі бір жиынына бастапқы өңдеудің әсері туралы білуге көмектеседі.

Екі түрлі емдеуді: бірінші кезекте көтермелеуді және алғашқы емдеуді басқару үшін бізге жаңа белгілер қажет. Кейбір адамдар кездейсоқ түрде құрастырылған ( $Z_i = 1$ ) немесе $Z_i = 0$ ( $Z_i = 0$ ); бұл жағдайда $Z_i$ кейде құрал деп аталады.

Кейбір адамдар жасақталған ( $Z_i = 1, W_i = 1$ ) және кейбіреулері ( $Z_i = 1, W_i = 0$ ). Сол сияқты, дайындалмағандардың кейбіреулері ( $Z_i = 0, W_i = 1$ ) және кейбіреулері ( $Z_i = 0, W_i = 0$ ) болды. Әрбір адамға арналған ықтимал нәтиже көтермелеуге де, емделуге де өз мәртебесін көрсету үшін кеңейтілуі мүмкін. Мысалы, $Y(1, W_i(1))$ $i$ егер ол жазылған болса, $i$ табысы болуы керек, мұнда $W_i(1)$ оның жасалған қызмет күйі болып табылады. Бұдан басқа, халықты төрт топқа бөлуге болады: компрессорлар, ешкімді алмастырғыштар, деферлер және әрдайым (кесте 2.7).

Кесте 2.7: Адамдардың төрт түрі
Түрі	Қызмет жасалған кезде	Қызмет жасалмаған болса, қызмет
Құрастырушылар	Иә, $W_i(Z_i=1) = 1$	Жоқ, $W_i(Z_i=0) = 0$
Ешқашан алма	Жоқ, $W_i(Z_i=1) = 0$	Жоқ, $W_i(Z_i=0) = 0$
Defiers	Жоқ, $W_i(Z_i=1) = 0$	Иә, $W_i(Z_i=0) = 1$
Әрдайым жолдаушылар	Иә, $W_i(Z_i=1) = 1$	Иә, $W_i(Z_i=0) = 1$

Емдеудің (яғни, әскери қызметтің) әсері туралы талқылау алдында біз алдымен ынталандырудың екі нәтижесін (яғни, әзірленетін) анықтай аламыз. Біріншіден, алғашқы емделуге қолдау көрсетудің тиімділігін анықтай аламыз. Екіншіден, нәтиже туралы жігерлендірудің нәтижесін анықтауға болады. Бұл екі нәтижені емделудің белгілі бір адамдар тобына әсер етуін бағалау үшін біріктіруге болады.

Біріншіден, емделуге арналған көтермелеудің әсері адамға $i$ ретінде анықталуы мүмкін

$\text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)$

Сонымен қатар, бұл сан бүкіл халыққа қатысты анықталуы мүмкін

$\text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)$

Ақырында, деректерді пайдаланып $\text{ITT} _{W}$ бағалауға болады:

$\widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)$

мұнда $\bar{W}^{\text{obs}}_1$ - бұл көтермеленген адамдарға арналған емделу тәртібі және $\bar{W}^{\text{obs}}_0$ емделмегендер үшін емделудің байқалатын көрсеткіші. $\text{ITT}_W$ кейде қабылдану жиілігі деп аталады.

Әрі қарай, нәтижеге қатысты көтермелеудің нәтижесі адамға $i$ келесідей анықталуы мүмкін:

$\text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)$

Сонымен қатар, бұл сан бүкіл халыққа қатысты анықталуы мүмкін

$\text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)$

Соңында, деректерді пайдаланып $\text{ITT}_{Y}$ бағалауға болады:

$\widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)$

мұнда $\bar{Y}^{\text{obs}}_1$ - бұл мақұлданған (мысалы, әзірленген) және $\bar{W}^{\text{obs}}_0$ - бұл ынталандырылмаған адамдарға арналған нәтиже.

Ақырында біз қызығушылықтың әсеріне назар аударамыз: бастапқы өңдеудің нәтижесі (мысалы, әскери қызмет) нәтижеге (мысалы, пайда). Өкінішке орай, бұл нәтиже барлық бірліктерде жалпы бағалауға болмайды. Дегенмен, кейбір жорамалдармен зерттеушілер емделушіні компиляторларға әсерін бағалауы мүмкін (яғни, дайындалған жағдайда қызмет ететін адамдар және жұмыс істемейтін адамдар болмаған жағдайда, 2.7-кесте). Мен осы бағаны мен компрессордың орташа нәтиже әсері (CACE) (кейде жергілікті орташа емдеу әсері деп аталады, LATE) деп атаймын:

$\text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)$

онда $G_i$ адам $i$ тобын сыйға тартады (2.7 кестені қараңыз) және $N_{\text{co}}$ компиляторлардың саны. Басқаша айтқанда, экв. 2.11 құрастырылған компиляторлардың табысын салыстырады $Y_i(1, W_i(1))$ және жазылмаған $Y_i(0, W_i(0))$ . Салыстырмалы экв. 2.11 бақыланатын деректерден бағалау қиын, себебі байқаушылардың тек бақыланатын деректерді (біреу біреуі комплаентті жасау керек пе, оның жұмыс жасаған-жасалмағанын және жасалмаған кезде қызмет атқарған-жатпағанын білу керек) білу мүмкін емес.

Айта кетейік, егер қандай да бір компиляторлар болса, онда ұсынылған үш қосымша болжам жасалады, CACE-ті бақыланатын деректерден бағалауға болады. Біріншіден, емдеуге тапсырма кездейсоқтық деп ойлауға болады. Лотерея жобасында бұл ақылға қонымды. Дегенмен, табиғи эксперименттер физикалық рандомизацияға сенбейтін кейбір жағдайларда, бұл болжам көп проблемалы болуы мүмкін. Екіншіден, олардың деферлері жоқ деп айтуға тура келеді (бұл болжам кейде монотондылықты болжау деп аталады). Жоба аясында жоба әзірленбеген болса, қызмет етпейтін және қызмет етпейтін өте аз адамдар бар деп санауға болады. Үшіншіден, ақыр соңында, шектеуді алып тастау деп аталатын ең маңызды болжам бар. Ерекше шектеулерге байланысты, емдеу тапсырмасының барлық әсері емнің өзі арқылы қабылданған деп есептелуі керек. Басқаша айтқанда, нәтиже бойынша көтермелеудің тікелей әсері жоқ деп есептеуге болады. Лотерея жобасына қатысты, мысалы, мәртебенің мәртебесі әскери қызметтен басқа кірістерге әсер етпейтінін болжау керек (2.11-сурет). Шығаруға шектеу бұзылуы мүмкін, мысалы, егер жұмысқа тартылған адамдар мектепте жұмыс уақытын ұзарта алмаса немесе жұмыс берушілер жұмысқа тартылған адамдарды жалдауға әлдеқайда аз болса, бұзылуы мүмкін.

2.11-сурет: Ерекшелену шектеуі (лотереяның жобасы) нәтижеге (пайдаға) тек емдеу (әскери қызмет) арқылы әсер етуін талап етеді. Ерекше шектеулерді бұзу мүмкін, мысалы, егер адамдар дайындықтан өтіп, мектепке уақытты жұмсап, қызметтен кетпейтін болса және мектептегі бұл уақыттың жоғарылауы жоғары табыс әкелсе.

Егер бұл үш жағдай (емдеуге кездейсоқ тағайындау, дефициар мен шектеуді шектеу) орындалса

$\text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)$

сондықтан CACE бағалай аламыз:

$\widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)$

CACE туралы ойланудың бір жолы - бұл ынталандырылғандармен және ынталандырылмағандармен салыстырғанда, нәтижеге жетудің артуымен салыстырғанда, айырмашылық.

Есте сақтау үшін екі маңызды ескерту бар. Біріншіден, шектеуді шектеу - бұл күшті болжам және әрбір жағдайда жеке-дара негізделуі керек, ол жиі субъектілердің сараптамасын талап етеді. Ерекше шектеулерді көтермелеудің рандомизациясымен негіздеуге болмайды. Екіншіден, инструментальды ауыспалы талдауымен жалпы практикалық шақыру емдеуді емдеуге әсер етпейтін кезде пайда болады ( $\text{ITT}_W$ кішкентай). Бұл әлсіз құрал деп аталады, және бұл көптеген мәселелерге әкеледі (Imbens and Rosenbaum 2005; Murray 2006) . Мәселе туралы әлсіз құралдармен ойланудың бір жолы, $\widehat{\text{CACE}}$ $\widehat{\text{ITT}_Y}$ сезімтал болуы мүмкін. шектеулерді болдырмау - себебі бұл қиянаттар кішігірім $\widehat{\text{ITT}_W}$ арқылы ұлғайтылады (қараңыз: 2.13). Егер табиғаттың тағайындаған емі сіз күтіп отырған емделуге үлкен әсер етпесе, онда сіз өзіңізге күтім жасайтын емдеу туралы қиын уақытты үйренесіз.

Бұл талқылаудың ресми нұсқасы үшін Imbens and Rubin (2015) 23 және 24 тарауларын қараңыз. Ауыспалы құралдарға дәстүрлі эконометриялық көзқарас әдетте ықтимал нәтижелерге емес, теңдеулерді бағалау тұрғысынан көрсетіледі. Басқа көзқараспен танысу үшін Angrist and Pischke (2009) бөлімін қараңыз және екі тәсіл арасындағы салыстыру үшін Imbens and Rubin (2015) 24.6) бөлімін қараңыз Imbens and Rubin (2015) . Gerber and Green (2012) 6-шы тарауында Gerber and Green (2012) альтернативті, инструменталды ауыспалы көзқарастың формальды тұсаукесері сәл аз. Ерекше шектеулер туралы қосымша ақпаратты D. Jones (2015) бөлімінен қараңыз. Aronow and Carnegie (2013) бағалаудың орнына АТЖ-ны бағалау үшін қолдануға болатын жорамалдардың қосымша жиынтығын сипаттайды. Табиғи эксперименттерді қалай түсіндіруге болатыны туралы қосымша ақпарат алу үшін Sekhon and Titiunik (2012) бөлімін қараңыз. Табиғи эксперименттерге неғұрлым жалпы Dunning (2012) регрессиялық үзіліс сияқты конструкцияларды қамтуға мүмкіндік беретін аспаптық ауыспалы тәсілдердің шеңберінен шығып кету - Dunning (2012) бөлімін қараңыз.