Catatan matematis

Dalam apendiks ini, saya akan merangkum beberapa gagasan tentang membuat inferensi kausal dari data non-eksperimental dalam bentuk yang sedikit lebih matematis. Ada dua pendekatan utama: kerangka grafik kausal, yang paling terkait dengan Judea Pearl dan rekan, dan kerangka hasil potensial, yang paling terkait dengan Donald Rubin dan rekan. Saya akan memperkenalkan kerangka hasil potensial karena lebih dekat dengan ide-ide dalam catatan matematika pada akhir bab 3 dan 4. Untuk lebih lanjut tentang kerangka grafik kausal, saya merekomendasikan Pearl, Glymour, and Jewell (2016) (pengantar ) dan Pearl (2009) (lanjutan). Untuk pengobatan panjang buku tentang kesimpulan kausal yang menggabungkan kerangka hasil potensial dan kerangka grafik kausal, saya merekomendasikan Morgan and Winship (2014) .

Tujuan dari apendiks ini adalah untuk membantu Anda merasa nyaman dengan notasi dan gaya dari tradisi hasil potensial sehingga Anda dapat beralih ke beberapa materi yang lebih teknis yang ditulis pada topik ini. Pertama, saya akan menjelaskan kerangka hasil potensial. Kemudian, saya akan menggunakannya untuk mendiskusikan lebih lanjut eksperimen alami seperti yang oleh Angrist (1990) tentang pengaruh layanan militer terhadap penghasilan. Apendiks ini sangat bergantung pada Imbens and Rubin (2015) .

Kerangka hasil potensial

Kerangka hasil potensial memiliki tiga elemen utama: unit , perawatan , dan hasil potensial . Untuk mengilustrasikan elemen-elemen ini, mari kita pertimbangkan versi yang bergaya dari pertanyaan yang dialamatkan di Angrist (1990) : Apa pengaruh layanan militer terhadap pendapatan? Dalam hal ini, kita dapat menentukan unit untuk menjadi orang yang memenuhi syarat untuk draft 1970 di Amerika Serikat, dan kita dapat mengindeks orang-orang ini dengan \(i = 1, \ldots, N\) . Perawatan dalam kasus ini dapat "melayani di militer" atau "tidak melayani di militer." Saya akan menyebut ini perawatan dan kondisi kontrol, dan saya akan menulis \(W_i = 1\) jika orang \(i\) berada dalam kondisi perawatan dan \(W_i = 0\) jika orang \(i\) berada dalam kondisi kontrol. Akhirnya, hasil potensial sedikit lebih sulit secara konseptual karena melibatkan hasil "potensial"; hal-hal yang bisa terjadi. Untuk setiap orang yang memenuhi syarat untuk draft tahun 1970, kita dapat membayangkan jumlah yang akan mereka dapatkan pada tahun 1978 jika mereka bertugas di militer, yang akan saya sebut \(Y_i(1)\) , dan jumlah yang akan mereka dapatkan di 1978 jika mereka tidak bertugas di militer, yang akan saya sebut \(Y_i(0)\) . Dalam kerangka hasil potensial, \(Y_i(1)\) dan \(Y_i(0)\) dianggap sebagai jumlah tetap, sedangkan \(W_i\) adalah variabel acak.

Pilihan unit, perawatan, dan hasil sangat penting karena menentukan apa yang bisa — dan tidak bisa — dipelajari dari penelitian. Pilihan unit — orang yang memenuhi syarat untuk rancangan tahun 1970 — tidak termasuk wanita, dan tanpa asumsi tambahan, penelitian ini tidak akan memberi tahu kita apa pun tentang pengaruh dinas militer pada wanita. Keputusan tentang bagaimana mendefinisikan perawatan dan hasil juga penting. Misalnya, haruskah perlakuan yang menarik difokuskan pada melayani di militer atau mengalami pertempuran? Haruskah hasil bunga menjadi penghasilan atau kepuasan kerja? Pada akhirnya, pilihan unit, perawatan, dan hasil harus didorong oleh tujuan ilmiah dan kebijakan dari penelitian.

Mengingat pilihan unit, perawatan, dan hasil potensial, efek kausal dari perawatan pada orang \(i\) , \(\tau_i\) , adalah

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]

Dengan kata lain, kita membandingkan berapa banyak orang \(i\) akan mendapatkan setelah melayani berapa banyak orang \(i\) akan mendapatkan tanpa penyajian. Bagi saya, eq. 2.1 adalah cara paling jelas untuk mendefinisikan efek kausal, dan meskipun sangat sederhana, kerangka ini ternyata dapat digeneralisasikan dalam banyak cara yang penting dan menarik (Imbens and Rubin 2015) .

Ketika menggunakan kerangka hasil potensial, saya sering merasa bermanfaat untuk menulis tabel yang menunjukkan hasil potensial dan efek perawatan untuk semua unit (tabel 2.5). Jika Anda tidak dapat membayangkan meja seperti ini untuk studi Anda, maka Anda mungkin perlu lebih tepat dalam definisi unit, perawatan, dan hasil potensial Anda.

Tabel 2.5: Tabel Potensi Hasil
Orang Penghasilan dalam kondisi perawatan Penghasilan dalam kondisi kontrol Efek pengobatan
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
Berarti \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

Ketika mendefinisikan efek kausal dengan cara ini, kita mengalami masalah. Di hampir semua kasus, kita tidak bisa mengamati kedua hasil potensial. Artinya, orang tertentu melayani atau tidak melayani. Oleh karena itu, kami mengamati salah satu hasil potensial— \(Y_i(1)\) atau \(Y_i(0)\) —tapi tidak keduanya. Ketidakmampuan untuk mengamati kedua hasil potensial adalah masalah besar yang oleh Holland (1986) menyebutnya sebagai Masalah Fundamental dari Inferensi Kausal .

Untungnya, ketika kita melakukan penelitian, kita tidak hanya memiliki satu orang; Sebaliknya, kami memiliki banyak orang, dan ini menawarkan jalan di sekitar Masalah Fundamental dari Inferensi Kausal. Daripada mencoba untuk memperkirakan efek pengobatan tingkat individu, kita dapat memperkirakan efek pengobatan rata - rata untuk semua unit:

\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]

Persamaan ini masih dinyatakan dalam istilah \(\tau_i\) , yang tidak dapat diamati, tetapi dengan beberapa aljabar (Persamaan 2.8 Gerber and Green (2012) ), kita mendapatkan

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]

Ini menunjukkan bahwa jika kita dapat memperkirakan hasil rata-rata populasi di bawah perlakuan ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) dan hasil rata-rata populasi di bawah kontrol ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), maka kita dapat memperkirakan efek pengobatan rata-rata, bahkan tanpa memperkirakan efek pengobatan untuk orang tertentu.

Sekarang setelah saya mendefinisikan perkiraan kami — hal yang kami coba perkirakan — saya akan beralih ke bagaimana kami dapat memperkirakannya dengan data. Dan di sini kita menjalankan langsung ke masalah yang hanya kita amati salah satu hasil potensial untuk setiap orang; kita melihat baik \(Y_i(0)\) atau \(Y_i(1)\) (tabel 2.6). Kami dapat memperkirakan efek pengobatan rata-rata dengan membandingkan penghasilan orang yang melayani penghasilan orang-orang yang tidak melayani:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]

di mana \(N_t\) dan \(N_c\) adalah jumlah orang dalam perawatan dan kondisi kontrol. Pendekatan ini akan bekerja dengan baik jika penugasan perawatan tidak bergantung pada hasil potensial, suatu kondisi yang kadang-kadang disebut ketidaktahuan . Sayangnya, dengan tidak adanya eksperimen, ketidaktahuan sering tidak puas, yang berarti bahwa estimator dalam persamaan. 2,4 tidak mungkin menghasilkan estimasi yang baik. Salah satu cara untuk berpikir tentang hal ini adalah bahwa tanpa adanya penugasan pengobatan secara acak, eq. 2.4 tidak membandingkan seperti dengan suka; itu membandingkan penghasilan dari berbagai jenis orang. Atau diungkapkan sedikit berbeda, tanpa penugasan pengobatan acak, alokasi pengobatan mungkin terkait dengan hasil potensial.

Dalam bab 4, saya akan menjelaskan bagaimana eksperimen terkontrol acak dapat membantu peneliti membuat perkiraan kausal, dan di sini saya akan menjelaskan bagaimana peneliti dapat mengambil keuntungan dari eksperimen alami, seperti rancangan lotere.

Tabel 2.6: Tabel Hasil yang Diamati
Orang Penghasilan dalam kondisi perawatan Penghasilan dalam kondisi kontrol Efek pengobatan
1 ? \(Y_1(0)\) ?
2 \(Y_2(1)\) ? ?
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) ? ?
Berarti ? ? ?

Eksperimen alami

Salah satu pendekatan untuk membuat perkiraan kausal tanpa menjalankan eksperimen adalah mencari sesuatu yang terjadi di dunia yang telah secara acak memberikan perawatan untuk Anda. Pendekatan ini disebut eksperimen alami . Dalam banyak situasi, sayangnya, alam tidak secara acak memberikan perawatan yang Anda inginkan kepada populasi yang Anda minati. Tetapi kadang-kadang, alam secara acak memberikan perawatan terkait. Secara khusus, saya akan mempertimbangkan kasus di mana ada beberapa perawatan sekunder yang mendorong orang untuk menerima perawatan utama . Sebagai contoh, draft dapat dianggap sebagai pengobatan sekunder yang secara acak yang mendorong beberapa orang untuk mengambil pengobatan utama, yang melayani di militer. Desain ini kadang disebut desain dorongan . Dan metode analisis yang akan saya jelaskan untuk menangani situasi ini kadang-kadang disebut variabel instrumental . Dalam pengaturan ini, dengan beberapa asumsi, peneliti dapat menggunakan dorongan untuk belajar tentang efek pengobatan utama untuk subset unit tertentu.

Untuk menangani dua perlakuan yang berbeda — dorongan dan perawatan utama — kami membutuhkan beberapa notasi baru. Misalkan beberapa orang secara acak disusun ( \(Z_i = 1\) ) atau tidak disusun ( \(Z_i = 0\) ); dalam situasi ini, \(Z_i\) kadang-kadang disebut instrumen .

Di antara mereka yang disusun, beberapa disajikan ( \(Z_i = 1, W_i = 1\) ) dan beberapa tidak ( \(Z_i = 1, W_i = 0\) ). Demikian pula, di antara mereka yang tidak disusun, beberapa disajikan ( \(Z_i = 0, W_i = 1\) ) dan beberapa tidak ( \(Z_i = 0, W_i = 0\) ). Hasil potensial untuk setiap orang sekarang dapat diperluas untuk menunjukkan status mereka baik untuk dorongan dan perawatan. Sebagai contoh, mari \(Y(1, W_i(1))\) adalah penghasilan orang \(i\) jika ia disusun, di mana \(W_i(1)\) adalah status layanannya jika disusun. Selanjutnya, kita dapat membagi populasi menjadi empat kelompok: compliers, never-takers, defiers, dan always-takers (tabel 2.7).

Tabel 2.7: Empat Tipe Orang
Mengetik Layanan jika disusun Layanan jika tidak disusun
Compliers Ya, \(W_i(Z_i=1) = 1\) Tidak, \(W_i(Z_i=0) = 0\)
Tak pernah mengambil Tidak, \(W_i(Z_i=1) = 0\) Tidak, \(W_i(Z_i=0) = 0\)
Pembela Tidak, \(W_i(Z_i=1) = 0\) Ya, \(W_i(Z_i=0) = 1\)
Selalu-pengambil Ya, \(W_i(Z_i=1) = 1\) Ya, \(W_i(Z_i=0) = 1\)

Sebelum kita membahas memperkirakan efek dari perawatan (mis., Layanan militer), pertama-tama kita dapat mendefinisikan dua efek dari dorongan (yaitu, sedang disusun). Pertama, kita dapat menentukan pengaruh dorongan pada pengobatan primer. Kedua, kita dapat mendefinisikan pengaruh dorongan pada hasil. Ini akan menghasilkan dua efek ini dapat dikombinasikan untuk memberikan perkiraan efek pengobatan pada sekelompok orang tertentu.

Pertama, efek dari dorongan pada pengobatan dapat didefinisikan untuk orang \(i\) sebagai

\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]

Selanjutnya, kuantitas ini dapat didefinisikan atas seluruh populasi sebagai

\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]

Akhirnya, kita dapat memperkirakan \(\text{ITT} _{W}\) menggunakan data:

\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]

di mana \(\bar{W}^{\text{obs}}_1\) adalah tingkat perawatan yang diamati bagi mereka yang didorong dan \(\bar{W}^{\text{obs}}_0\) adalah tingkat pengobatan yang diamati untuk mereka yang tidak didorong. \(\text{ITT}_W\) juga kadang-kadang disebut tingkat serapan .

Selanjutnya, efek dari dorongan pada hasil dapat ditentukan untuk orang \(i\) sebagai:

\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]

Selanjutnya, kuantitas ini dapat didefinisikan atas seluruh populasi sebagai

\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]

Akhirnya, kita dapat memperkirakan \(\text{ITT}_{Y}\) menggunakan data:

\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]

di mana \(\bar{Y}^{\text{obs}}_1\) adalah hasil yang diamati (misalnya, penghasilan) bagi mereka yang didorong (misalnya, disusun) dan \(\bar{W}^{\text{obs}}_0\) adalah hasil yang diamati bagi mereka yang tidak didorong.

Akhirnya, kami mengalihkan perhatian kami pada efek bunga: efek dari perlakuan utama (misalnya, layanan militer) pada hasil (misalnya, penghasilan). Sayangnya, ternyata tidak dapat, secara umum, memperkirakan efek ini pada semua unit. Namun, dengan beberapa asumsi, peneliti dapat memperkirakan efek pengobatan pada compliers (yaitu, orang yang akan melayani jika disusun dan orang-orang yang tidak akan melayani jika tidak disusun, tabel 2.7). Saya akan menyebut estimasi ini dan efek kausal rata-rata komper (CACE) (yang juga kadang-kadang disebut efek pengobatan rata-rata lokal , LATE):

\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]

di mana \(G_i\) menyumbangkan grup orang \(i\) (lihat tabel 2.7) dan \(N_{\text{co}}\) adalah jumlah compliers. Dengan kata lain, eq. 2.11 membandingkan laba dari compliers yang disusun \(Y_i(1, W_i(1))\) dan tidak disusun \(Y_i(0, W_i(0))\) . Estimand dalam persamaan. 2.11 tampaknya sulit untuk memperkirakan dari data yang diobservasi karena tidak mungkin untuk mengidentifikasi compliers hanya menggunakan data yang diamati (untuk mengetahui apakah seseorang adalah compiler Anda akan perlu untuk mengamati apakah ia melayani ketika disusun dan apakah ia melayani ketika tidak disusun).

Ternyata - agak mengejutkan - bahwa jika ada kompromi, maka asalkan satu membuat tiga asumsi tambahan, adalah mungkin untuk memperkirakan CACE dari data yang diamati. Pertama, seseorang harus menganggap bahwa penugasan untuk pengobatan adalah acak. Dalam kasus rancangan lotere ini masuk akal. Namun, dalam beberapa pengaturan di mana eksperimen alami tidak bergantung pada pengacakan fisik, asumsi ini mungkin lebih bermasalah. Kedua, kita harus mengasumsikan bahwa mereka bukan pembela (asumsi ini juga kadang-kadang disebut asumsi monotonisitas). Dalam konteks rancangan tampaknya masuk akal untuk mengasumsikan bahwa ada sangat sedikit orang yang tidak akan melayani jika disusun dan akan melayani jika tidak disusun. Ketiga, dan akhirnya, muncul asumsi yang paling penting yang disebut pembatasan pengecualian . Di bawah pembatasan pengecualian, seseorang harus menganggap bahwa semua efek dari tugas pengobatan dilewatkan melalui perawatan itu sendiri. Dengan kata lain, seseorang harus berasumsi bahwa tidak ada efek langsung dari dorongan pada hasil. Dalam kasus rancangan lotere, misalnya, seseorang perlu mengasumsikan bahwa status draf tidak berpengaruh pada penghasilan selain melalui dinas militer (gambar 2.11). Pembatasan pengecualian dapat dilanggar jika, misalnya, orang-orang yang dikonsepkan menghabiskan lebih banyak waktu di sekolah untuk menghindari layanan atau jika pengusaha cenderung mempekerjakan orang yang dikonsep.

Gambar 2.11: Pembatasan pengecualian mengharuskan bahwa dorongan (lotre rancangan) memiliki efek pada hasil (penghasilan) hanya melalui perlakuan (dinas militer). Pembatasan pengecualian dapat dilanggar jika, misalnya, orang-orang yang dikonsepkan menghabiskan lebih banyak waktu di sekolah untuk menghindari layanan dan bahwa peningkatan waktu di sekolah ini mengarah ke penghasilan yang lebih tinggi.

Gambar 2.11: Pembatasan pengecualian mengharuskan bahwa dorongan (lotre rancangan) memiliki efek pada hasil (penghasilan) hanya melalui perlakuan (dinas militer). Pembatasan pengecualian dapat dilanggar jika, misalnya, orang-orang yang dikonsepkan menghabiskan lebih banyak waktu di sekolah untuk menghindari layanan dan bahwa peningkatan waktu di sekolah ini mengarah ke penghasilan yang lebih tinggi.

Jika ketiga kondisi ini (tugas acak untuk perawatan, tidak ada pembelaan, dan pembatasan pengecualian) terpenuhi, maka

\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]

jadi kami dapat memperkirakan CACE:

\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]

Salah satu cara untuk berpikir tentang CACE adalah bahwa perbedaan hasil antara mereka yang didorong dan mereka yang tidak didorong, dipompa oleh tingkat penyerapan.

Ada dua peringatan penting yang harus diingat. Pertama, pembatasan pengecualian adalah asumsi yang kuat, dan itu perlu dibenarkan atas dasar kasus per kasus, yang sering membutuhkan keahlian bidang-subjek. Pembatasan pengecualian tidak dapat dibenarkan dengan pengacakan dorongan. Kedua, tantangan praktis umum dengan analisis variabel instrumental muncul ketika dorongan memiliki sedikit pengaruh pada serapan pengobatan (ketika \(\text{ITT}_W\) kecil). Ini disebut instrumen yang lemah , dan itu mengarah ke berbagai masalah (Imbens and Rosenbaum 2005; Murray 2006) . Salah satu cara untuk berpikir tentang masalah dengan instrumen yang lemah adalah bahwa \(\widehat{\text{CACE}}\) dapat sensitif terhadap bias kecil di \(\widehat{\text{ITT}_Y}\) -mungkin karena pelanggaran pembatasan pengecualian-karena bias ini diperbesar oleh kecil \(\widehat{\text{ITT}_W}\) (lihat persamaan. 2.13). Kira-kira, jika perawatan yang diberikan alam tidak memiliki dampak besar pada perawatan yang Anda pedulikan, maka Anda akan mengalami kesulitan belajar tentang perawatan yang Anda minati.

Lihat bab 23 dan 24 dari Imbens and Rubin (2015) untuk versi yang lebih formal dari diskusi ini. Pendekatan ekonometrik tradisional untuk variabel instrumental biasanya dinyatakan dalam hal memperkirakan persamaan, bukan hasil potensial. Untuk pengantar dari perspektif lain ini, lihat Angrist and Pischke (2009) , dan untuk perbandingan antara dua pendekatan, lihat bagian 24.6 dari Imbens and Rubin (2015) . Sebuah alternatif, presentasi yang kurang formal dari pendekatan variabel instrumental diberikan dalam bab 6 dari Gerber and Green (2012) . Untuk lebih lanjut tentang pembatasan pengecualian, lihat D. Jones (2015) . Aronow and Carnegie (2013) menjelaskan satu set asumsi tambahan yang dapat digunakan untuk memperkirakan ATE daripada CACE. Untuk lebih lanjut tentang bagaimana eksperimen alami bisa sangat sulit ditafsirkan, lihat Sekhon and Titiunik (2012) . Untuk pengenalan yang lebih umum terhadap eksperimen alami — eksperimen yang melampaui pendekatan variabel instrumental juga mencakup desain seperti diskontinuitas regresi — lihat Dunning (2012) .