Cathetan matématika

Ing apendiks iki, aku bakal ngringkes sawetara gagasan babagan nggawe kasalahan kesimpulan saka data non-eksperimental ing wangun rada luwih matématika. Ana rong pendekatan utamane: kerangka grafik kaasaman, paling digandhengake karo Judea Pearl lan kolega, lan kerangka asil potensial, paling digandhengake karo Donald Rubin lan kanca-kanca. Aku bakal ngenalake kerangka asil potensial amarga luwih mirip karo gagasan-gagasan ing cathetan matématika ing pungkasan bab 3 lan 4. Kanggo luwih Pearl, Glymour, and Jewell (2016) kerangka grafik, aku saranake Pearl, Glymour, and Jewell (2016) (pambuka ) lan Pearl (2009) (maju). Kanggo perawatan buku-buku kesimpulan sebab-akibat sing nggabungake kerangka kerja potensial lan kerangka grafik sing nyebabake, aku nyaranake Morgan and Winship (2014) .

Tujuan saka apendiks iki yaiku kanggo mbantu sampeyan nyukupi karo notasi lan gaya tradhisi hasil potensial supaya sampeyan bisa transisi menyang sawetara materi teknis sing ditulis ing topik iki. Kawitan, aku bakal njlèntrèhaké kerangka kerja potensial. Banjur, aku bakal digunakake kanggo mbahas luwih jero percobaan alam kayata dening Angrist (1990) babagan pengaruh layanan militer marang penghasilan. Lampiran iki Imbens and Rubin (2015) banget marang Imbens and Rubin (2015) .

Potensi kerangka kerja hasil

Kerangka hasil potensial duwe telung elemen utama: unit , pangobatan , lan hasil potensial . Kanggo nggambarake unsur-unsur kasebut, ayo nimbang versi babagan pitakonan sing ditangani ing Angrist (1990) : Apa efek layanan militèr marang penghasilan? Ing kasus iki, kita bisa nemtokake unit dadi wong sing layak kanggo rancangan taun 1970 ing Amerika Serikat, lan kita bisa ndèkèkaké wong-wong iki kanthi \(i = 1, \ldots, N\) . Pangobatan ing kasus iki bisa "nglayani ing militèr" utawa "ora ana ing militèr." Aku bakal nyeluk iki syarat-syarat perawatan lan kontrol, lan aku bakal nulis \(W_i = 1\) yen wong \(i\) ana ing kondisi perawatan lan \(W_i = 0\) yen wong \(i\) ing kondisi kontrol. Pungkasan, asil potensial luwih angel tinimbang konsekuensine amarga kedadeyan "potensial"; apa sing bisa kedadeyan. Kanggo saben wong sing layak kanggo rancangan 1970, kita bisa mbayangake jumlah sing bakal ditampa nalika taun 1978 yen dheweke njabat militèr, sing aku bakal nelpon \(Y_i(1)\) , lan jumlah sing bakal ditampa ing 1978 yen dheweke ora melu ing militèr, sing aku bakal nelpon \(Y_i(0)\) . Ing kerangka asil potensial, \(Y_i(1)\) lan \(Y_i(0)\) dianggep kuantitas tetep, dene \(W_i\) minangka variabel acak.

Pilihan saka unit, pangobatan, lan asil kritis amarga nemtokake apa sing bisa lan ora bisa dipelajari saka sinau. Pilihan saka unit-wong sing layak kanggo rancangan 1970-ora kalebu wanita, lan tanpa asumsi tambahan, panliten iki ora bakal nyritakake apa-apa bab pengaruh layanan militer marang wanita. Keputusan babagan carane nemtokake pangobatan lan kasil penting uga. Contone, manawa perawatan saka kapentingan bisa difokusake kanggo militer utawa ngalami pertempuran? Apa asil saka kapentingan bisa dadi penghasilan utawa kepuasan kerja? Pungkasan, pilihan unit, pangobatan, lan asil kudu didhukung dening tujuan ilmiah lan kawruh saka panliten kasebut.

Dadi pilihan saka unit, pangobatan, lan hasil potensial, efek sing nyebabake pangobatan ing wong \(i\) , \(\tau_i\) , iku

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]

Ing tembung liyane, kita mbandhingake carane wong \(i\) bakal entuk sawise ngladeni manawa wong \(i\) bakal entuk tanpa porsi. Kanggo kula, eq. 2.1 minangka cara paling jelas kanggo nemtokake efek sing nyebabake, lan sanajan arang banget prasaja, kerangka iki dadi umum ing akeh cara sing penting lan menarik (Imbens and Rubin 2015) .

Nalika nggunakake kerangka kerja potensial, aku kerep nemokake babagan nulis sawijining tabel sing nuduhake asil potensial lan efek perawatan kanggo kabeh unit (tabel 2.5). Yen sampeyan ora bisa mbayangake tabel kaya iki kanggo sinau, sampeyan kudu luwih tepat ing definisi unit, pangobatan, lan hasil potensial.

Tabel 2.5: Tabel Potensial Hasil
Wong Pangentukan ing kondisi perawatan Pangentukan ing kahanan kontrol Efek perawatan
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
Tegese \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

Nanging, nalika nemtokake akibat sing nyebabake, kita bisa dadi masalah. Ing meh kabeh kasus, kita ora bisa netepi loro potensial hasil. Sing, wong tartamtu sing ditugasake utawa ora dilayani. Mulane, kita mirsani salah sawijining hasil potensial- \(Y_i(1)\) utawa \(Y_i(0)\) -nanging ora loro. Ketidakmampuan kanggo mirsani kedadeyan potensial kuwi masalah utama sing diarani Holland (1986) Masalah Dasar saka Kesimpulan Kesalahan .

Begjanipun, nalika kita nindakake riset, kita ora mung duwe siji wong; Dadi, kita duwe akeh wong, lan iki menehi saran babagan Masalah Dhasar Sababane Kesimpulan. Tinimbang nyoba kanggo ngira efek perawatan tingkat individu, kita bisa ngira efek perawatan rata - rata kanggo kabeh unit:

\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]

Persamaan iki isih ditulis ing istilah \(\tau_i\) , sing ora bisa ditemtokake, nanging kanthi sawetara aljabar (eq 2.8 saka Gerber and Green (2012) ), kita bisa

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]

Iki nuduhake yen yen kita bisa ngira yen rata-rata asil populasi ing perawatan ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) lan hasil rata - rata populasi ing kontrol ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), banjur bisa ngira efek perawatan rata-rata, sanajan ora ngira efek perawatan kanggo wong tartamtu.

Saiki aku wis nemtokake prakiraan kita-apa sing kita nyoba kanggo ngira-Aku bakal nguripake carane kita bisa ngira-ngira kanthi data. Lan ing kene kita mlaku langsung menyang masalah sing mung kita mirsani salah sawijining hasil potensial kanggo saben wong; kita ndeleng salah siji \(Y_i(0)\) utawa \(Y_i(1)\) (Tabel 2.6). Kita bisa ngira efek perawatan rata-rata dening mbandhingake penghasilan wong sing dadi penghasilan wong sing ora ngawula:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]

ngendi \(N_t\) lan \(N_c\) iku nomer wong ing kondisi perawatan lan kontrol. Pendekatan iki bakal luwih apik yen tugas assignment ora ana ing asil potensial, sawijining kondisi sing kadhangkala disebut ignorability . Sayange, tanpa anané eksperimen, ora keprihatinan ora asring puas, sing tegese pengirahe ing persamaan. 2.4 ora bisa ngasilake perkiraan apik. Salah siji cara kanggo mikir babagan iku yen ora ana tugas assignment acak, eq. 2.4 ora mbandingake kaya kaya; Iki mbandhingake penghasilan saka macem-macem jinis wong. Utawa diterangake rada beda, tanpa assignment perawatan acak, alokasi pangobatan kasebut mungkin ana hubungane karo potensial hasil.

Ing bab 4, aku bakal njlèntrèhaké babagan eksperimen sing dikontrol kanthi acak bisa mbiyantu para panaliti nyinaoni perkiraan kausal, lan ing kene aku bakal nggambarake carane para peneliti bisa ngupayakake eksperimen alami, kayata lotre konsep.

Tabel 2.6: Tabel Hasil Panaliti
Wong Pangentukan ing kondisi perawatan Pangentukan ing kahanan kontrol Efek perawatan
1 ? \(Y_1(0)\) ?
2 \(Y_2(1)\) ? ?
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) ? ?
Tegese ? ? ?

Eksperimen alami

Siji pendekatan kanggo nggawe perkiraan nyebabake tanpa nglakoni eksperimen yaiku nggoleki soko kedadeyan ing donya sing wis ditugasake kanthi acak kanggo sampeyan. Pendekatan iki diarani eksperimen alami . Ing sapérangan kahanan, sayangé, alam ora sacara acak ngirimake perawatan sing dikarepake kanggo kapentingan. Nanging kadhangkala, alam sacara acak ngirimake perawatan sing gegandhengan. Utamane, aku bakal nimbang kasus sing ana sawetara perawatan sekunder sing nyengkuyung wong nampa perawatan utama . Contone, konsep kasebut bisa dianggep minangka perawatan sekunder sing ditugasake kanthi acak sing nyengkuyung sawetara wong kanggo njupuk perawatan utama, sing ditugasake ing militer. Rancangan iki kadhangkala disebut desain dorongan . Lan cara analisis sing bakal dakkandhakake kanggo nangani kahanan iki kadhangkala disebut variabel instrumental . Ing setelan iki, kanthi sawetara asumsi, panaliti bisa nggunakake dhuwit kanggo mangerteni efek saka perawatan utama kanggo subset tartamtu saka unit.

Kanggo ngatasi loro pangobatan sing beda-dorongan lan perawatan utama-kita butuh sawetara notasi anyar. Upaminipun sawetara wong wis diadopsi kanthi acak ( \(Z_i = 1\) ) utawa ora disusun ( \(Z_i = 0\) ); ing kahanan iki, \(Z_i\) kadhangkala disebut instrument .

Antarane sing disusun, sawetara \(Z_i = 1, W_i = 1\) ( \(Z_i = 1, W_i = 1\) ) lan sawetara ora ( \(Z_i = 1, W_i = 0\) ). Dadi, ing antarane sing ora disusun, sawetara ana ( \(Z_i = 0, W_i = 1\) ) lan sawetara ora ( \(Z_i = 0, W_i = 0\) ). Hasil potensial kanggo saben wong saiki bisa ditambahi kanggo nuduhake status kanggo dorongan lan perawatan kasebut. Contone, supaya \(Y(1, W_i(1))\) dadi penghasilan wong \(i\) yen dheweke disusun, ing ngendi \(W_i(1)\) minangka status layanane yen disusun. Luwih, kita bisa pamisah populasi dadi 4 kelompok: compliers, never-takers, defiers, and always-takers (tabel 2.7).

Tabel 2.7: Empat Jinis Wong
Ketik Layanan yen disusun Layanan yen ora disusun
Panganggo Ya, \(W_i(Z_i=1) = 1\) Ora, \(W_i(Z_i=0) = 0\)
Aja-takers Ora, \(W_i(Z_i=1) = 0\) Ora, \(W_i(Z_i=0) = 0\)
Defiers Ora, \(W_i(Z_i=1) = 0\) Ya, \(W_i(Z_i=0) = 1\)
Tansah takers Ya, \(W_i(Z_i=1) = 1\) Ya, \(W_i(Z_i=0) = 1\)

Sadurunge kita ngrembug ngitung efek saka perawatan (ie, layanan militer), kita bisa nemtokake luwih dhisik loro efek saka dorongan (ie, disusun). Kawitan, kita bisa nemtokake efek saka dorongan ing perawatan utama. Kapindho, kita bisa nemtokake efek saka dorongan ing asil. Iku bakal nguripake yen efek loro iki bisa dikombinasikake kanggo nyedhiyakake perkiraan efek saka perawatan ing klompok tartamtu wong.

Kaping pisanan, efek saka dorongan kanggo perawatan bisa ditetepake kanggo wong \(i\) minangka

\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]

Luwih, jumlah iki bisa ditemtokake liwat kabeh populasi minangka

\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]

Pungkasan, kita bisa ngira \(\text{ITT} _{W}\) nggunakake data:

\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]

ing ngendi \(\bar{W}^{\text{obs}}_1\) minangka tingkat observasi kanggo wong sing dianjurake lan \(\bar{W}^{\text{obs}}_0\) Tingkat pengamatan kanggo sing ora dianjurake. \(\text{ITT}_W\) uga kadhangkala disebut tingkat uptake .

Sabanjure, efek dorongan ing asil bisa ditetepake kanggo wong \(i\) minangka:

\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]

Luwih, jumlah iki bisa ditemtokake liwat kabeh populasi minangka

\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]

Pungkasan, kita bisa ngira \(\text{ITT}_{Y}\) nggunakake data:

\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]

ngendi \(\bar{Y}^{\text{obs}}_1\) punika kasil diamati (eg, pangentukan) sing padha diwanti-wanti (eg, mlebet) lan \(\bar{W}^{\text{obs}}_0\) yaiku asil sing diamati kanggo wong sing ora dianjurake.

Pungkasan, kita nggatekake manungsa waé kanggo efek saka kapentingan: efek saka perawatan utama (kayata, layanan militer) ing asil (eg, penghasilan). Sayange, ternyata ora bisa, ing umum, ngira efek iki ing kabeh unit. Nanging, kanthi asumsi sawetara, panaliti bisa ngira efek saka perawatan ing complier (ie, wong sing bakal ngawasi yen diarani lan wong sing ora bakal ngawula manawa ora digawé, tabel 2.7). Aku bakal nelpon prabawa iki minangka efek nyebabake rata-rata (CACE) (sing uga disebut minangka efek perawatan rata-rata lokal , LATE):

\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]

ing ngendi \(G_i\) nyumbang grup wong \(i\) (pirsani tabel 2.7) lan \(N_{\text{co}}\) minangka jumlah penyusun. Ing tembung liyane, eq. 2.11 mbandhingake penghitungan sing wis disusun \(Y_i(1, W_i(1))\) lan ora diolah \(Y_i(0, W_i(0))\) . Estimasi ing eq. 2.11 asring banget kanggo ngira saka data sing ditemtokake amerga ora bisa ngenali pandhita nggunakake mung data sing diamati (kanggo mangerteni yen ana wong sing ngetrapake sampeyan kudu netepake apa sing dilakoni nalika disusun lan apa sing dilakoni nalika ora digawé).

Dadi metu-kaya-banget-yen yen ana apa wae sing ngrampungake, banjur menehi siji nggawe telung asumsi tambahan, bisa dianggep CACE saka data sing diamati. Kawitan, siji kudu nganggep yen tugas kanggo perawatan acak. Ing kasus lotre konsep iki cukup. Nanging, ing sawetara pratelan ing ngendi eksperimen alam ora gumantung ing ragad fisik, asumsi iki bisa dadi luwih problematis. Kapindho, siji kudu nganggep yen ora ana defiers (asumsi iki uga kadhangkala disebut asumsi monotonicitas). Ing konteks rancangan kasebut, misale akal kanggo nganggep menawa ana sawetara banget wong sing ora bakal ngladeni manawa disusun lan bakal ditindakake yen ora disusun. Katelu, lan pungkasanipun, rawuh minangka asumsi paling penting sing disebut watesan khusus . Ing ngisor watesan pengecualian, siji kudu nganggep yen kabeh efek saka assignment perawatan wis dilewati liwat perawatan dhewe. Ing tembung liya, siji kudu nganggep ora ana efek langsung saka dorongan marang asil. Ing kasus lotre konsep, umpamane, siji kudu nganggep menawa status konsep ora duweni pangaruh ing pangasilan kejaba liwat layanan militer (gambar 2.11). Watesan pengecualian bisa dilanggar yen, umpamane, wong sing diarani ngginakaken luwih akeh wektu ing sekolah kanggo nyegah layanan utawa yen majikan kurang mungkin ngundhuh wong sing disusun.

Gambar 2.11: Watesan pengecualian mbutuhake yen dorongan (lotre rancangan) duweni pengaruh marang asil (penghasilan) mung liwat perawatan (layanan militer). Watesan pengecualian bisa dilanggar yen, umpamane, wong sing disusun ngentekake wektu luwih akeh ing sekolah kanggo nyegah layanan lan wektu tambah ing sekolah iki nyebabake penghasilan luwih dhuwur.

Gambar 2.11: Watesan pengecualian mbutuhake yen dorongan (lotre rancangan) duweni pengaruh marang asil (penghasilan) mung liwat perawatan (layanan militer). Watesan pengecualian bisa dilanggar yen, umpamane, wong sing disusun ngentekake wektu luwih akeh ing sekolah kanggo nyegah layanan lan wektu tambah ing sekolah iki nyebabake penghasilan luwih dhuwur.

Yen katelu kasebut (assignment acak kanggo perawatan, ora ana defiers, lan watesan pengecualian) ketemu, banjur

\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]

supaya kita bisa ngira CACE:

\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]

Salah siji cara kanggo mikir babagan CACE yaiku sing prabédan ing asil antarane wong-wong sing didhukung lan sing ora didhukung, inflated dening tingkat uptake.

Ana rong pandawa penting kanggo mbudidaya. Pisanan, watesan pengecualian kasebut minangka asumsi sing kuat, lan kudu dibenerake miturut basis kasus, sing asring mbutuhake keahlian subyek. Watesan pengecualian ora bisa dibenerake kanthi acak ing dorongan. Kapindho, tantangan praktis sing umum karo analisis variabel instrumental bakal teka yen dorongan ora nduweni pangaruh ing pengobatan (nalika \(\text{ITT}_W\) cilik. Iki diarani instrumen sing lemah , lan ndadékaké manéka masalah (Imbens and Rosenbaum 2005; Murray 2006) . Salah siji cara kanggo mikir babagan masalah karo instrumen sing lemah yaiku \(\widehat{\text{CACE}}\) bisa dadi sensitif marang bias cilik ing \(\widehat{\text{ITT}_Y}\) -begina amarga Pelanggaran watesan pengecualian-amarga bias kasebut bisa digedhekake kanthi cilik \(\widehat{\text{ITT}_W}\) (pirsani pasal 2.13). Sacara kasar, yen perawatan sing ditampa alam ora duwe pangaruh sing gedhe marang perawatan sing dikonsepake, sampeyan bakal nyedhaki wektu mbantah babagan perawatan sing sampeyan tresnani.

Waca bab 23 lan 24 saka Imbens and Rubin (2015) kanggo versi sing luwih formal saka diskusi iki. Pendekatan ekonomi kanggo variabel instrumèntal tradisional biasané ditulis ing istilah ngitung persamaan, ora asil potensial. Kanggo perspektif saka perspektif liyane, waca Angrist and Pischke (2009) , lan kanggo comparison antarane rong pendekatan, waca bagean 24.6 saka Imbens and Rubin (2015) . Alternatif, presentation presentation rada kurang formal saka pendekatan instrumental instrumental diwenehake ing bab 6 saka Gerber and Green (2012) . Kanggo luwih lengkap babagan watesan khusus, waca D. Jones (2015) . Aronow and Carnegie (2013) nggambarake sawetara asumsi tambahan sing bisa digunakake kanggo ngira ATE tinimbang CACE. Kanggo luwih Sekhon and Titiunik (2012) babagan carane eksperimen alami bisa dadi angel banget kanggo napsirake, waca Sekhon and Titiunik (2012) . Kanggo introduksi sing luwih umum kanggo eksperimen alami-siji sing ngluwihi mung pendekatan instrumental instrumental uga kalebu rancangan kaya diskontinuitas-deleng Dunning (2012) .