ບັນທຶກຄະນິດສາດ

ໃນເອກະສານຊ້ອນນີ້, ຂ້າພະເຈົ້າຈະສະຫຼຸບບາງຄໍາແນະນໍາກ່ຽວກັບການຄິດໄລ່ຂໍ້ອ້າງອີງຈາກຂໍ້ມູນທີ່ບໍ່ມີການທົດລອງໃນຮູບແບບທາງຄະນິດສາດເລັກນ້ອຍ. ມີສອງວິທີການຕົ້ນຕໍ: ກອບຮູບວົງໂຄຈອນທີ່ພົວພັນກັບ Juda Pearl ແລະເພື່ອນຮ່ວມງານ, ແລະຂອບເຂດທີ່ມີທ່າແຮງທີ່ກ່ຽວຂ້ອງກັບ Donald Rubin ແລະເພື່ອນຮ່ວມງານ. ຂ້າພະເຈົ້າຈະແນະນໍາກອບຜົນລັບທີ່ເປັນໄປໄດ້ເພາະວ່າມັນເຊື່ອມຕໍ່ກັບແນວຄວາມຄິດໃນຄະນິດສາດໃນຕອນທ້າຍຂອງພາກທີ 3 ແລະ 4. ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມກ່ຽວກັບຂອບເຂດກາຟທີ່ເກີດຂື້ນ, ຂ້າພະເຈົ້າຂໍແນະນໍາ Pearl, Glymour, and Jewell (2016) (introductory ) ແລະ Pearl (2009) (ຂັ້ນສູງ). ສໍາລັບການປິ່ນປົວຄວາມຍາວຂອງຫນັງສືທີ່ກ່ຽວຂ້ອງກັບຜົນສະທ້ອນທີ່ກ່ຽວຂ້ອງກັບຂອບເຂດຜົນກະທົບທີ່ອາດເກີດຂື້ນແລະກອບກາຟຟິກ causal, ຂ້າພະເຈົ້າຂໍແນະນໍາໃຫ້ Morgan and Winship (2014) .

ເປົ້າຫມາຍຂອງເອກະສານຊ້ອນນີ້ແມ່ນເພື່ອຊ່ວຍໃຫ້ທ່ານໄດ້ຮັບຄວາມສະດວກສະບາຍກັບການກໍານົດແລະແບບຂອງຜົນປະໂຫຍດທາງປະເພນີທີ່ມີທ່າແຮງເພື່ອໃຫ້ທ່ານສາມາດປ່ຽນບາງຢ່າງຂອງອຸປະກອນທາງດ້ານວິຊາການທີ່ຂຽນໄວ້ໃນຫົວຂໍ້ນີ້. ຫນ້າທໍາອິດ, ຂ້າພະເຈົ້າຈະອະທິບາຍຂອບເຂດທີ່ມີທ່າແຮງ. ຫຼັງຈາກນັ້ນ, ຂ້າພະເຈົ້າຈະນໍາໃຊ້ມັນເພື່ອປຶກສາຫາລືກ່ຽວກັບການທົດລອງແບບທໍາມະຊາດເຊັ່ນຫນຶ່ງໂດຍ Angrist (1990) ກ່ຽວກັບຜົນກະທົບຂອງການບໍລິການດ້ານການທະຫານໃນລາຍໄດ້. ເອກະສານຊ້ອນນີ້ລ້ວນແຕ່ໃສ່ Imbens and Rubin (2015) .

ຂອບໃຈຜົນປະໂຫຍດຂອບ

ຂອບເຂດຜົນຜະລິດທີ່ມີທ່າແຮງມີສາມອົງປະກອບຕົ້ນຕໍຄື: ຫນ່ວຍງານ , ການປິ່ນປົວ , ແລະ ຜົນໄດ້ຮັບທີ່ອາດເກີດຂື້ນ . ເພື່ອສະແດງໃຫ້ເຫັນອົງປະກອບເຫຼົ່ານີ້, ໃຫ້ພິຈາລະນາເບິ່ງຄໍາຖາມທີ່ຖືກແກ້ໄຂໃນ Angrist (1990) : ຜົນກະທົບຂອງການບໍລິການດ້ານການທະຫານຕໍ່ຜົນກໍາໄລແມ່ນຫຍັງ? ໃນກໍລະນີນີ້, ພວກເຮົາສາມາດກໍານົດ ຫນ່ວຍງານ ວ່າເປັນຄົນທີ່ມີສິດໄດ້ຮັບການສະບັບຮ່າງໃນສະຫະລັດອາເມລິກາ, ແລະພວກເຮົາສາມາດດັດລາຍປະຊາຊົນເຫຼົ່ານີ້ໂດຍ \(i = 1, \ldots, N\) . ການ ປິ່ນປົວ ໃນກໍລະນີນີ້ສາມາດ "ຮັບໃຊ້ໃນການທະຫານ" ຫຼື "ບໍ່ຮັບໃຊ້ໃນການທະຫານ." ຂ້ອຍຈະໂທຫາເງື່ອນໄຂການປິ່ນປົວແລະຄວບຄຸມເຫຼົ່ານີ້ແລະຂ້ອຍຈະຂຽນ \(W_i = 1\) ຖ້າບຸກຄົນ \(i\) ແມ່ນຢູ່ໃນສະພາບການປິ່ນປົວແລະ \(W_i = 0\) ຖ້າບຸກຄົນ \(i\) ຢູ່ໃນສະພາບການຄວບຄຸມ. ສຸດທ້າຍ, ຜົນໄດ້ຮັບທີ່ມີທ່າແຮງ ແມ່ນມີຄວາມຫຍຸ້ງຍາກທາງດ້ານແນວຄິດທີ່ມີຄວາມຫຍຸ້ງຍາກຫຼາຍເພາະວ່າພວກເຂົາມີຜົນໄດ້ຮັບ "ຜົນປະໂຫຍດ"; ສິ່ງທີ່ອາດຈະເກີດຂຶ້ນ. ສໍາລັບແຕ່ລະບຸກຄົນທີ່ມີສິດໄດ້ຮັບການສະບັບຮ່າງປີ 1970, ພວກເຮົາສາມາດຈິນຕະນາການຈໍານວນເງິນທີ່ພວກເຂົາຈະໄດ້ຮັບໃນປີ 1978 ຖ້າພວກເຂົາເຮັດຫນ້າທີ່ໃນການທະຫານເຊິ່ງຂ້ອຍຈະເອີ້ນວ່າ \(Y_i(1)\) ແລະຈໍານວນເງິນທີ່ພວກເຂົາຈະໄດ້ຮັບໃນ 1978 ຖ້າພວກເຂົາບໍ່ໄດ້ຮັບໃຊ້ໃນການທະຫານ, ທີ່ຂ້ອຍຈະເອີ້ນວ່າ \(Y_i(0)\) . ໃນຂອບເຂດທີ່ມີທ່າແຮງ, \(Y_i(1)\) ແລະ \(Y_i(0)\) ຖືກພິຈາລະນາປະລິມານຄົງທີ່, ໃນຂະນະທີ່ \(W_i\) ເປັນຕົວແປທີ່ຫຼາກຫຼາຍ.

ການເລືອກເອົາຫົວຫນ່ວຍ, ການປິ່ນປົວແລະຜົນໄດ້ຮັບແມ່ນສໍາຄັນເພາະວ່າມັນກໍານົດສິ່ງທີ່ສາມາດແລະບໍ່ສາມາດຮຽນຮູ້ໄດ້ຈາກການສຶກສາ. ການເລືອກຂອງຫນ່ວຍງານ - ຜູ້ທີ່ມີສິດໄດ້ຮັບການແຕ່ງຕັ້ງໃນປີ 1970 - ບໍ່ປະກອບມີແມ່ຍິງ, ແລະດັ່ງນັ້ນໂດຍບໍ່ມີການສົມມຸດເພີ່ມເຕີມ, ການສຶກສານີ້ຈະບໍ່ບອກພວກເຮົາກ່ຽວກັບຜົນກະທົບຂອງການບໍລິການດ້ານການທະຫານຕໍ່ແມ່ຍິງ. ການຕັດສິນໃຈກ່ຽວກັບວິທີການກໍານົດການປິ່ນປົວແລະຜົນໄດ້ຮັບແມ່ນສໍາຄັນເຊັ່ນກັນ. ຕົວຢ່າງເຊັ່ນການປິ່ນປົວຄວາມສົນໃຈຄວນສຸມໃສ່ການຮັບໃຊ້ໃນການທະຫານຫຼືປະສົບການຕໍ່ສູ້? ຜົນໄດ້ຮັບທີ່ຫນ້າສົນໃຈຄວນເປັນລາຍໄດ້ຫຼືຄວາມພໍໃຈໃນວຽກງານບໍ? ໃນທີ່ສຸດ, ການເລືອກເອົາຫົວຫນ່ວຍ, ການປິ່ນປົວ, ແລະຜົນໄດ້ຮັບຄວນຖືກນໍາໃຊ້ໂດຍເປົ້າຫມາຍຂອງວິທະຍາສາດແລະນະໂຍບາຍຂອງການສຶກສາ.

ເນື່ອງຈາກການເລືອກຂອງຫນ່ວຍງານ, ການປິ່ນປົວແລະຜົນໄດ້ຮັບທີ່ເປັນໄປໄດ້, ຜົນກະທົບຂອງການປິ່ນປົວຕໍ່ບຸກຄົນທີ່ \(i\) , \(\tau_i\) , ແມ່ນ

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]

ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ພວກເຮົາສົມທຽບວິທີການຫຼາຍຄົນ \(i\) ຈະໄດ້ຮັບຫຼັງຈາກການຮັບໃຊ້ເພື່ອເຮັດແນວໃດບຸກຄົນທີ່ຫຼາຍ \(i\) ຈະໄດ້ຮັບໂດຍບໍ່ມີການຮັບໃຊ້. ກັບຂ້ອຍ, eq. 2.1 ແມ່ນວິທີທີ່ຊັດເຈນທີ່ສຸດໃນການກໍານົດຜົນກະທົບທາງດ້ານປະລິມານ, ແລະເຖິງແມ່ນວ່າງ່າຍດາຍທີ່ສຸດ, ກອບນີ້ຈະເປັນໄປໄດ້ໂດຍທົ່ວໄປໃນຫຼາຍວິທີທີ່ສໍາຄັນແລະຫນ້າສົນໃຈ (Imbens and Rubin 2015) .

ໃນເວລາທີ່ນໍາໃຊ້ຂອບຂອງຜົນໄດ້ຮັບທີ່ມີທ່າແຮງ, ຂ້າພະເຈົ້າມັກພົບວ່າມັນເປັນປະໂຫຍດທີ່ຈະຂຽນອອກຕາຕະລາງສະແດງໃຫ້ເຫັນຜົນໄດ້ຮັບແລະຜົນກະທົບດ້ານການປິ່ນປົວສໍາລັບຫນ່ວຍງານທັງຫມົດ (ຕາຕະລາງ 2.5). ຖ້າທ່ານບໍ່ສາມາດຈິນຕະນາການຕາຕະລາງເຊັ່ນນີ້ສໍາລັບການສຶກສາຂອງທ່ານ, ທ່ານອາດຈໍາເປັນຕ້ອງມີຄວາມຊັດເຈນໃນການຄໍານິຍາມຂອງຫນ່ວຍງານ, ການປິ່ນປົວແລະຜົນຂອງທ່ານ.

ຕາຕະລາງ 2.5: ຕາຕະລາງຜົນໄດ້ຮັບທີ່ມີທ່າແຮງ
ບຸກຄົນ ລາຍຮັບໃນສະພາບການປິ່ນປົວ ກໍາໄຮໃນເງື່ອນໄຂຄວບຄຸມ ຜົນກະທົບການປິ່ນປົວ
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
ຫມາຍຄວາມວ່າ \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

ໃນເວລາທີ່ກໍານົດຜົນກະທົບທາງສາເຫດໃນທາງນີ້, ຢ່າງໃດກໍຕາມ, ພວກເຮົາດໍາເນີນການເປັນບັນຫາ. ໃນເກືອບທຸກໆກໍລະນີ, ພວກເຮົາບໍ່ໄດ້ສັງເກດເບິ່ງຜົນໄດ້ຮັບທັງສອງຢ່າງ. ນັ້ນແມ່ນ, ບຸກຄົນໃດຫນຶ່ງທີ່ໄດ້ຮັບຜິດຊອບຫຼືບໍ່ຮັບໃຊ້. ດັ່ງນັ້ນ, ພວກເຮົາສັງເກດເຫັນຫນຶ່ງໃນຜົນໄດ້ຮັບທີ່ມີທ່າແຮງ - \(Y_i(1)\) ຫຼື \(Y_i(0)\) - ແຕ່ບໍ່ແມ່ນທັງສອງ. ການບໍ່ສາມາດສັງເກດເບິ່ງຜົນໄດ້ຮັບທັງສອງແມ່ນບັນຫາທີ່ສໍາຄັນທີ່ Holland (1986) ເອີ້ນວ່າ ບັນຫາພື້ນຖານຂອງຄວາມຮູ້ສາເຫດ .

ໂຊກດີ, ເມື່ອພວກເຮົາດໍາເນີນການຄົ້ນຄວ້າ, ພວກເຮົາບໍ່ພຽງແຕ່ມີຄົນຫນຶ່ງ; ແທນທີ່ຈະ, ພວກເຮົາມີປະຊາຊົນຈໍານວນຫຼາຍ, ແລະນີ້ສະຫນອງວິທີການປະມານບັນຫາພື້ນຖານຂອງການເປັນສາເຫດ Inference. ແທນທີ່ຈະພະຍາຍາມປະເມີນຜົນຂອງການປິ່ນປົວແຕ່ລະລະດັບ, ພວກເຮົາສາມາດປະເມີນ ຜົນກະທົບດ້ານການປິ່ນປົວໂດຍສະເລ່ຍຕໍ່ ຫົວຫນ່ວຍທັງຫມົດ:

\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]

ສະມະການນີ້ຍັງສະແດງອອກໃນແງ່ຂອງ \(\tau_i\) ຊຶ່ງບໍ່ສາມາດສັງເກດເຫັນໄດ້ແຕ່ມີບາງອັນຄະລໍາ (eq 2.8 ຂອງ Gerber and Green (2012) ), ພວກເຮົາໄດ້ຮັບ

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]

ນີ້ສະແດງໃຫ້ເຫັນວ່າຖ້າພວກເຮົາສາມາດຄາດຄະເນຜົນໄດ້ຮັບໂດຍສະເລ່ຍຂອງປະຊາກອນພາຍໃຕ້ການປິ່ນປົວ ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) ແລະຜົນໄດ້ຮັບສະເລ່ຍຂອງປະຊາກອນພາຍໃຕ້ການຄວບຄຸມ ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), ຫຼັງຈາກນັ້ນ, ພວກເຮົາສາມາດຄາດຄະເນຜົນກະທົບຂອງການປິ່ນປົວໂດຍສະເລ່ຍ, ເຖິງແມ່ນວ່າບໍ່ມີການຄາດຄະເນຜົນກະທົບດ້ານການປິ່ນປົວສໍາລັບບຸກຄົນໃດຫນຶ່ງ.

ໃນປັດຈຸບັນທີ່ຂ້າພະເຈົ້າໄດ້ກໍານົດການຄາດຄະເນຂອງພວກເຮົາ - ສິ່ງທີ່ພວກເຮົາກໍາລັງພະຍາຍາມຄາດຄະເນ - ຂ້ອຍຈະເຮັດແນວໃດທີ່ພວກເຮົາສາມາດປະເມີນມັນດ້ວຍຂໍ້ມູນ. ແລະໃນທີ່ນີ້ພວກເຮົາດໍາເນີນການໂດຍກົງກັບບັນຫາທີ່ພວກເຮົາສັງເກດເຫັນຫນຶ່ງໃນຜົນໄດ້ຮັບທີ່ມີທ່າແຮງສໍາລັບແຕ່ລະບຸກຄົນ; ພວກເຮົາເຫັນວ່າ \(Y_i(0)\) ຫຼື \(Y_i(1)\) (ຕາຕະລາງ 26). ພວກເຮົາສາມາດຄາດຄະເນຜົນກະທົບດ້ານການປິ່ນປົວໂດຍການປຽບທຽບລາຍໄດ້ຂອງຄົນທີ່ເຮັດໃຫ້ລາຍໄດ້ຂອງຜູ້ທີ່ບໍ່ໄດ້ຮັບໃຊ້:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]

ບ່ອນທີ່ \(N_t\) ແລະ \(N_c\) ແມ່ນຈໍານວນຂອງຄົນໃນສະພາບການປິ່ນປົວແລະຄວບຄຸມ. ວິທີການນີ້ຈະເຮັດວຽກດີຖ້າການມອບຫມາຍການປິ່ນປົວແມ່ນເປັນເອກະລາດຂອງຜົນໄດ້ຮັບທີ່ເປັນໄປໄດ້, ເງື່ອນໄຂທີ່ບາງຄັ້ງເອີ້ນວ່າການບໍ່ ຮູ້ຕົວ . ແຕ່ຫນ້າເສຍດາຍ, ໃນເວລາທີ່ບໍ່ມີການທົດລອງ, ການບໍ່ເຂົ້າໃຈແມ່ນບໍ່ພໍໃຈເລື້ອຍໆ, ຊຶ່ງຫມາຍຄວາມວ່າການຄາດຄະເນໃນ eq. 2.4 ບໍ່ແມ່ນການຄາດຄະເນທີ່ດີ. ຫນຶ່ງໃນວິທີທີ່ຈະຄິດກ່ຽວກັບມັນແມ່ນວ່າໃນເວລາທີ່ບໍ່ມີການມອບຫມາຍໃຫ້ການປິ່ນປົວແບບສຸ່ມ, eq. 2.4 ແມ່ນບໍ່ປຽບທຽບກັບຄ້າຍຄືກັນ; ມັນແມ່ນການປຽບທຽບລາຍໄດ້ຂອງປະຊາຊົນທີ່ແຕກຕ່າງກັນ. ຫຼືສະແດງຄວາມແຕກຕ່າງເລັກນ້ອຍ, ໂດຍບໍ່ມີການມອບຫມາຍໃຫ້ການປິ່ນປົວແບບສຸ່ມ, ການຈັດສັນການປິ່ນປົວອາດຈະກ່ຽວຂ້ອງກັບຜົນໄດ້ຮັບທີ່ອາດເກີດຂື້ນ.

ໃນບົດທີ 4, ຂ້ອຍຈະອະທິບາຍວິທີການທົດລອງຄວບຄຸມແບບສຸ່ມທີ່ສາມາດຊ່ວຍໃຫ້ນັກຄົ້ນຄວ້າໄດ້ປະເມີນຜົນເຫດຜົນ, ແລະໃນທີ່ນີ້ຂ້ອຍຈະອະທິບາຍວິທີວິໄຈສາມາດນໍາໃຊ້ວິທີການທົດລອງແບບທໍາມະຊາດເຊັ່ນ:

ຕາຕະລາງ 2.6: ຕາຕະລາງຜົນໄດ້ຮັບສັງເກດ
ບຸກຄົນ ລາຍຮັບໃນສະພາບການປິ່ນປົວ ກໍາໄຮໃນເງື່ອນໄຂຄວບຄຸມ ຜົນກະທົບການປິ່ນປົວ
1 ? \(Y_1(0)\) ?
2 \(Y_2(1)\) ? ?
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) ? ?
ຫມາຍຄວາມວ່າ ? ? ?

ປະສົບການທໍາມະຊາດ

ວິທີຫນຶ່ງເພື່ອເຮັດໃຫ້ການຄາດຄະເນກ່ຽວກັບເຫດຜົນທີ່ບໍ່ໄດ້ດໍາເນີນການທົດລອງແມ່ນເພື່ອຊອກຫາສິ່ງທີ່ເກີດຂື້ນໃນໂລກທີ່ໄດ້ຮັບການແຕ່ງຕັ້ງແບບສຸ່ມສໍາລັບທ່ານ. ວິທີການນີ້ເອີ້ນວ່າ ການທົດລອງທາງທໍາມະຊາດ . ໃນຫຼາຍໆສະຖານະການ, ຫນ້າເສຍດາຍ, ທໍາມະຊາດບໍ່ໄດ້ໃຫ້ການປິ່ນປົວແບບສຸ່ມທີ່ທ່ານຕ້ອງການໃຫ້ປະຊາກອນທີ່ມີຄວາມສົນໃຈ. ແຕ່ບາງຄັ້ງ, ລັກສະນະທີ່ມີລັກສະນະສຸ່ມທີ່ມີການປິ່ນປົວທີ່ກ່ຽວຂ້ອງ. ໂດຍສະເພາະ, ຂ້າພະເຈົ້າຈະພິຈາລະນາກໍລະນີທີ່ມີ ການຮັກສາຂັ້ນສອງ ທີ່ສົ່ງຜົນກະທົບຕໍ່ຄົນທີ່ໄດ້ຮັບການ ປິ່ນປົວຂັ້ນຕົ້ນ . ຍົກຕົວຢ່າງ, ຮ່າງນີ້ສາມາດຖືວ່າເປັນການປິ່ນປົວມັດທະຍົມທີ່ໄດ້ຮັບການມອບຫມາຍແບບສຸ່ມເຊິ່ງຊຸກຍູ້ໃຫ້ປະຊາຊົນບາງຄົນໄດ້ຮັບການປິ່ນປົວຂັ້ນຕົ້ນ, ເຊິ່ງໄດ້ຮັບໃຊ້ໃນການທະຫານ. ການອອກແບບນີ້ແມ່ນບາງຄັ້ງເອີ້ນວ່າການ ອອກກໍາລັງໃຈ . ແລະວິທີການວິເຄາະທີ່ຂ້ອຍຈະອະທິບາຍເພື່ອຈັດການກັບສະຖານະການນີ້ແມ່ນບາງຄັ້ງເອີ້ນວ່າ ຕົວແປຄໍາສັບ ຕ່າງໆ. ໃນການຕັ້ງຄ່ານີ້, ມີການສົມມຸດບາງ, ນັກຄົ້ນຄວ້າສາມາດນໍາໃຊ້ການຊຸກຍູ້ເພື່ອຮຽນຮູ້ກ່ຽວກັບຜົນກະທົບຂອງການປິ່ນປົວຂັ້ນຕົ້ນສໍາລັບຊຸດຂອງສະເພາະໃດຫນຶ່ງ.

ເພື່ອຈັດການສອງການປິ່ນປົວທີ່ແຕກຕ່າງກັນ - ການຊຸກຍູ້ແລະການປິ່ນປົວຂັ້ນຕົ້ນ - ພວກເຮົາຈໍາເປັນຕ້ອງມີການສັງເກດໃຫມ່. ສົມມຸດວ່າປະຊາຊົນບາງຄົນໄດ້ຖືກ drafted ຢ່າງວ່ອງໄວ ( \(Z_i = 1\) ) ຫຼືບໍ່ໄດ້ຮ່າງ ( \(Z_i = 0\) ); ໃນສະຖານະການນີ້, \(Z_i\) ແມ່ນບາງຄັ້ງເອີ້ນວ່າ ເຄື່ອງມື .

ໃນບັນດາຜູ້ທີ່ໄດ້ຮັບການແຕ່ງງານ, ບາງຄົນໄດ້ຮັບໃຊ້ ( \(Z_i = 1, W_i = 1\) ) ແລະບາງຄົນບໍ່ໄດ້ ( \(Z_i = 1, W_i = 0\) ). ເຊັ່ນດຽວກັນ, ໃນບັນດາຜູ້ທີ່ບໍ່ໄດ້ຮັບການແຕ່ງຕັ້ງ, ບາງຄົນໄດ້ຮັບໃຊ້ ( \(Z_i = 0, W_i = 1\) ) ແລະບາງຄົນບໍ່ໄດ້ ( \(Z_i = 0, W_i = 0\) ). ຜົນໄດ້ຮັບທີ່ມີທ່າແຮງສໍາລັບບຸກຄົນແຕ່ລະຄົນສາມາດຂະຫຍາຍຕົວໄດ້ເພື່ອສະແດງສະຖານະພາບຂອງເຂົາເຈົ້າສໍາລັບການສະຫນັບສະຫນູນແລະການປິ່ນປົວ. ຕົວຢ່າງໃຫ້ \(Y(1, W_i(1))\) ເປັນລາຍໄດ້ຂອງບຸກຄົນ \(i\) ຖ້າເຂົາຖືກຕໍາແຫນ່ງ, ບ່ອນທີ່ \(W_i(1)\) ແມ່ນສະຖານະການການບໍລິການຂອງລາວຖ້າມີການຮ່າງ. ນອກຈາກນັ້ນ, ພວກເຮົາສາມາດແຍກປະຊາກອນອອກເປັນສີ່ກຸ່ມ: ນັກຄອມພິວເຕີ, ຜູ້ທີ່ບໍ່ເຄີຍໃຊ້, ຜູ້ບັງຄັບບັນຊາແລະຜູ້ສະເຫມີ (ຕາຕະລາງ 2.7).

ຕາຕະລາງ 2.7: ສີ່ປະເພດຂອງປະຊາຊົນ
ປະເພດ Service if drafted ບໍລິການຖ້າບໍ່ໄດ້ຮ່າງ
Complier ແມ່ນ, \(W_i(Z_i=1) = 1\) ບໍ່, \(W_i(Z_i=0) = 0\)
ຜູ້ທີ່ບໍ່ເຄີຍເອົາໃຈໃສ່ ບໍ່, \(W_i(Z_i=1) = 0\) ບໍ່, \(W_i(Z_i=0) = 0\)
Defiers ບໍ່, \(W_i(Z_i=1) = 0\) ແມ່ນ, \(W_i(Z_i=0) = 1\)
ຜູ້ຕາງຫນ້າສະເຫມີ ແມ່ນ, \(W_i(Z_i=1) = 1\) ແມ່ນ, \(W_i(Z_i=0) = 1\)

ກ່ອນທີ່ພວກເຮົາຈະປຶກສາຫາລືກ່ຽວກັບຜົນກະທົບຂອງການປິ່ນປົວ (ຕົວຢ່າງ, ການບໍລິການທາງທະຫານ), ພວກເຮົາທໍາອິດຈະສາມາດກໍານົດສອງຜົນກະທົບຂອງການໃຫ້ກໍາລັງໃຈ (ເຊັ່ນ, ການຮ່າງ). ທໍາອິດ, ພວກເຮົາສາມາດກໍານົດຜົນກະທົບຂອງການຊຸກຍູ້ການປິ່ນປົວຂັ້ນຕົ້ນ. ອັນທີສອງ, ພວກເຮົາສາມາດກໍານົດຜົນກະທົບຂອງການສະຫນັບສະຫນູນໃນຜົນໄດ້ຮັບ. ມັນຈະເຮັດໃຫ້ຜົນກະທົບທັງສອງນີ້ສາມາດຖືກລວມເພື່ອສະຫນອງການຄາດຄະເນຜົນກະທົບຂອງການປິ່ນປົວໃນກຸ່ມຜູ້ທີ່ສະເພາະໃດຫນຶ່ງ.

ຫນ້າທໍາອິດ, ຜົນກະທົບຂອງການໃຫ້ກໍາລັງໃຈກ່ຽວກັບການປິ່ນປົວສາມາດຖືກກໍານົດສໍາລັບບຸກຄົນ \(i\) ເປັນ

\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]

ນອກຈາກນັ້ນ, ປະລິມານນີ້ສາມາດຖືກກໍານົດໃນປະຊາກອນທັງຫມົດ

\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]

ສຸດທ້າຍ, ພວກເຮົາສາມາດປະເມີນ \(\text{ITT} _{W}\) ໂດຍໃຊ້ຂໍ້ມູນ:

\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]

ບ່ອນທີ່ \(\bar{W}^{\text{obs}}_1\) ແມ່ນອັດຕາການປິ່ນປົວທີ່ສັງເກດສໍາລັບຜູ້ທີ່ໄດ້ຮັບການຊຸກຍູ້ແລະ \(\bar{W}^{\text{obs}}_0\) ແມ່ນ ອັດຕາການປິ່ນປົວທີ່ສັງເກດເຫັນສໍາລັບຜູ້ທີ່ບໍ່ໄດ້ສະຫນັບສະຫນູນ. \(\text{ITT}_W\) ແມ່ນບາງຄັ້ງເອີ້ນວ່າ ອັດຕາການດູດຊຶມ .

ຕໍ່ໄປ, ຜົນກະທົບຂອງການສະຫນັບສະຫນູນກ່ຽວກັບຜົນໄດ້ຮັບສາມາດຖືກກໍານົດສໍາລັບບຸກຄົນ \(i\) ຄື:

\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]

ນອກຈາກນັ້ນ, ປະລິມານນີ້ສາມາດຖືກກໍານົດໃນປະຊາກອນທັງຫມົດ

\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]

ສຸດທ້າຍ, ພວກເຮົາສາມາດປະມານ \(\text{ITT}_{Y}\) ໂດຍໃຊ້ຂໍ້ມູນ:

\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]

ທີ່ \(\bar{Y}^{\text{obs}}_1\) ເປັນຜົນໄດ້ຮັບຂໍ້ສັງເກດ (ຕົວຢ່າງ:, ລາຍຮັບ) ສໍາລັບຜູ້ທີ່ຖືກຊຸກຍູ້ໃຫ້ (ຕົວຢ່າງ:, ຮ່າງ) ແລະ \(\bar{W}^{\text{obs}}_0\) ແມ່ນຜົນໄດ້ຮັບສໍາລັບຜູ້ທີ່ບໍ່ໄດ້ສະຫນັບສະຫນູນ.

ສຸດທ້າຍ, ພວກເຮົາເອົາໃຈໃສ່ເຖິງຜົນກະທົບຂອງຄວາມສົນໃຈ: ຜົນກະທົບຂອງການປິ່ນປົວຂັ້ນຕົ້ນ (ເຊັ່ນ: ການບໍລິການທາງທະຫານ) ກ່ຽວກັບຜົນໄດ້ຮັບ (ເຊັ່ນ: ລາຍຮັບ). ແຕ່ຫນ້າເສຍດາຍ, ມັນສະຫຼຸບວ່າຫນຶ່ງບໍ່ສາມາດ, ໂດຍທົ່ວໄປ, ຄາດຄະເນຜົນກະທົບນີ້ກ່ຽວກັບຫນ່ວຍງານທັງຫມົດ. ຢ່າງໃດກໍ່ຕາມ, ດ້ວຍຄວາມສົມມຸດບາງ, ນັກຄົ້ນຄວ້າສາມາດຄາດຄະເນຜົນກະທົບຂອງການປິ່ນປົວຕໍ່ນັກບັນຊີ (ຕົວຢ່າງ, ຜູ້ທີ່ຈະຮັບໃຊ້ຖ້າວ່າຮ່າງແລະຜູ້ທີ່ບໍ່ຮັບໃຊ້ຖ້າບໍ່ໄດ້ຮ່າງ, ຕາຕະລາງ 2.7). ຂ້າພະເຈົ້າຈະໂທຫາການຄາດຄະເນນີ້ແລະ ຜົນກະທົບຕໍ່ຜົນກະທົບໂດຍສະເລ່ຍ (CACE) (ເຊິ່ງບາງຄັ້ງກໍ່ເອີ້ນວ່າ ຜົນກະທົບດ້ານການປິ່ນປົວໃນທ້ອງຖິ່ນ , LATE):

\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]

ບ່ອນທີ່ \(G_i\) ບໍລິຈາກກຸ່ມຂອງບຸກຄົນ \(i\) (ເບິ່ງຕາຕະລາງ 2.7) ແລະ \(N_{\text{co}}\) ແມ່ນຈໍານວນນັກຂຽນ. ໃນຄໍາສັບຕ່າງໆອື່ນໆ, eq. 2.11 ປຽບທຽບລາຍໄດ້ຂອງນັກຂຽນທີ່ຖືກກະຕືລືລົ້ນ \(Y_i(1, W_i(1))\) ແລະບໍ່ໄດ້ຮ່າງໄວ້ \(Y_i(0, W_i(0))\) . ການຄາດຄະເນໃນ eq. 2.11 ເບິ່ງຄືວ່າຍາກທີ່ຈະຄາດຄະເນຈາກຂໍ້ມູນທີ່ສັງເກດເຫັນເພາະວ່າມັນບໍ່ສາມາດກໍານົດຕົວເລກໂດຍໃຊ້ຂໍ້ມູນທີ່ສັງເກດໄດ້ເທົ່ານັ້ນ (ເພື່ອໃຫ້ຮູ້ວ່າມີໃຜສາມາດສັງເກດໄດ້ວ່າທ່ານໄດ້ຮັບຜິດຊອບໃນເວລາໃດກໍ່ຕາມ.

ມັນເປັນສິ່ງທີ່ຫນ້າແປກໃຈທີ່ວ່າຖ້າມີບົດຂຽນໃດໆ, ຫຼັງຈາກນັ້ນໃຫ້ຫນຶ່ງເຮັດໃຫ້ສາມຂໍ້ສົມມຸດເພີ່ມເຕີມ, ມັນສາມາດຄາດຄະເນ CACE ຈາກຂໍ້ມູນທີ່ສັງເກດໄດ້. ຫນ້າທໍາອິດ, ຫນຶ່ງຕ້ອງສົມມຸດວ່າການມອບຫມາຍໃຫ້ການປິ່ນປົວແມ່ນເປັນການເຂົ້າໃຈ. ໃນກໍລະນີຂອງ lottery ຮ່າງນີ້ແມ່ນສົມເຫດສົມຜົນ. ຢ່າງໃດກໍ່ຕາມ, ໃນບາງບ່ອນທີ່ທົດລອງທາງທໍາມະຊາດບໍ່ອີງໃສ່ການສຸ່ມທາງດ້ານຮ່າງກາຍ, ການສົມມຸດຕິຖານນີ້ອາດຈະມີບັນຫາຫຼາຍ. ອັນທີສອງ, ຫນຶ່ງຕ້ອງສົມມຸດວ່າພວກເຂົາບໍ່ມີ defiers (ສົມມຸດຕິຖານນີ້ແມ່ນບາງຄັ້ງກໍ່ເອີ້ນວ່າສົມມຸດຕິຖານຂອງ monotonicity). ໃນສະພາບການຂອງຮ່າງນັ້ນ, ມັນເບິ່ງຄືວ່າສົມເຫດສົມຜົນທີ່ຈະຖືວ່າມີປະຊາຊົນຈໍານວນຫນ້ອຍທີ່ຈະບໍ່ຮັບໃຊ້ຖ້າຖືກຮ່າງແລະຈະຮັບໃຊ້ຖ້າບໍ່ໄດ້ຮັບການຮ່າງ. ອັນທີສາມ, ແລະສຸດທ້າຍ, ມາສົມມຸດຕິຖານທີ່ສໍາຄັນທີ່ເອີ້ນວ່າ ຂໍ້ຈໍາກັດການຍົກເວັ້ນ . ພາຍໃຕ້ການຈໍາກັດການປະຕິເສດ, ຫນຶ່ງຕ້ອງສົມມຸດວ່າຜົນກະທົບທັງຫມົດຂອງການປະຕິບັດການປິ່ນປົວແມ່ນຜ່ານການປິ່ນປົວຕົວເອງ. ໃນຄໍາສັບຕ່າງໆອື່ນ, ຫນຶ່ງຕ້ອງຄິດວ່າບໍ່ມີຜົນກະທົບໂດຍກົງຕໍ່ການສະຫນັບສະຫນູນໃນຜົນໄດ້ຮັບ. ຍົກຕົວຢ່າງ, ໃນກໍລະນີຂອງ lottery ຮ່າງ, ພວກເຮົາຕ້ອງສົມມຸດວ່າສະຖານະພາບຮ່າງບໍ່ມີຜົນຕໍ່ຜົນປະໂຫຍດນອກເຫນືອຈາກການບໍລິການທາງທະຫານ (ຮູບທີ່ 2.11). ຍົກເລີກການຍົກເວັ້ນອາດຈະຖືກລະເມີດຖ້າຕົວຢ່າງ, ຜູ້ທີ່ຖືກແຕ່ງຕັ້ງໃຫ້ໃຊ້ເວລາຫຼາຍກວ່າຢູ່ໃນໂຮງຮຽນເພື່ອຫຼີກເວັ້ນການບໍລິການຫຼືຖ້ານາຍຈ້າງມີໂອກາດຫນ້ອຍທີ່ຈະຈ້າງຄົນທີ່ຖືກຕາງຫນ້າ.

ຮູບພາບ 2.11: ຂໍ້ຈໍາກັດການຍົກເວັ້ນຮຽກຮ້ອງໃຫ້ການສະຫນັບສະຫນູນ (ການອອກແບບລ້າ) ມີຜົນຕໍ່ຜົນໄດ້ຮັບ (ລາຍໄດ້) ເທົ່ານັ້ນໂດຍຜ່ານການປິ່ນປົວ (ການບໍລິການທາງທະຫານ). ຍົກເລີກການຍົກເວັ້ນອາດຈະຖືກລະເມີດຖ້າຕົວຢ່າງ, ຜູ້ທີ່ຖືກຕາງຫນ້າໃຊ້ເວລາຫຼາຍກວ່າຢູ່ໃນໂຮງຮຽນເພື່ອຫຼີກເວັ້ນການບໍລິການແລະວ່າເວລາທີ່ເພີ່ມຂຶ້ນໃນໂຮງຮຽນໄດ້ເຮັດໃຫ້ລາຍໄດ້ສູງຂຶ້ນ.

ຮູບພາບ 2.11: ຂໍ້ຈໍາກັດການຍົກເວັ້ນຮຽກຮ້ອງໃຫ້ການສະຫນັບສະຫນູນ (ການອອກແບບລ້າ) ມີຜົນຕໍ່ຜົນໄດ້ຮັບ (ລາຍໄດ້) ເທົ່ານັ້ນໂດຍຜ່ານການປິ່ນປົວ (ການບໍລິການທາງທະຫານ). ຍົກເລີກການຍົກເວັ້ນອາດຈະຖືກລະເມີດຖ້າຕົວຢ່າງ, ຜູ້ທີ່ຖືກຕາງຫນ້າໃຊ້ເວລາຫຼາຍກວ່າຢູ່ໃນໂຮງຮຽນເພື່ອຫຼີກເວັ້ນການບໍລິການແລະວ່າເວລາທີ່ເພີ່ມຂຶ້ນໃນໂຮງຮຽນໄດ້ເຮັດໃຫ້ລາຍໄດ້ສູງຂຶ້ນ.

ຖ້າຫາກວ່າເງື່ອນໄຂເຫຼົ່ານີ້ສາມ (ການມອບຫມາຍໃຫ້ການປິ່ນປົວແບບບໍ່ດີ, ບໍ່ມີ defiers, ແລະຂໍ້ຈໍາກັດການຍົກເວັ້ນ) ແມ່ນຖືກພົບ, ຫຼັງຈາກນັ້ນ

\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]

ດັ່ງນັ້ນພວກເຮົາສາມາດປະເມີນ CACE:

\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]

ວິທີຫນຶ່ງທີ່ຄິດກ່ຽວກັບ CACE ແມ່ນວ່າມັນແມ່ນຄວາມແຕກຕ່າງໃນຜົນໄດ້ຮັບລະຫວ່າງຜູ້ທີ່ໄດ້ຮັບການສະຫນັບສະຫນູນແລະຜູ້ທີ່ບໍ່ສະຫນັບສະຫນູນ, ອັດຕາການອັດຕາການດູດຊຶມ.

ມີສອງຄໍາເຕືອນທີ່ສໍາຄັນທີ່ຈະຕ້ອງຢູ່ໃນໃຈ. ຫນ້າທໍາອິດ, ການຈໍາກັດການຍົກເວັ້ນແມ່ນການສົມມຸດຖານທີ່ເຂັ້ມແຂງ, ແລະມັນຕ້ອງໄດ້ຮັບການແກ້ໄຂໃນກໍລະນີໂດຍແຕ່ລະກໍລະນີ, ເຊິ່ງມັກຈະຕ້ອງມີຄວາມຊໍານານໃນພື້ນທີ່. ການຈໍາກັດການຍົກເວັ້ນບໍ່ສາມາດຖືກຍົກເວັ້ນທີ່ມີການແຈກຢາຍຂອງການສະຫນັບສະຫນູນ. ອັນທີສອງ, ສິ່ງທ້າທາຍທີ່ມີປະສິດທິພາບທົ່ວໄປທີ່ມີການວິເຄາະການປ່ຽນແປງແບບອຸປະກອນມາເມື່ອການສະຫນັບສະຫນູນມີຜົນກະທົບນ້ອຍໆກ່ຽວກັບການດູດຊຶມຂອງການປິ່ນປົວ (ເມື່ອ \(\text{ITT}_W\) ເລັກນ້ອຍ. ນີ້ເອີ້ນວ່າ ເຄື່ອງມືທີ່ອ່ອນແອ ແລະມັນກໍ່ນໍາໄປສູ່ບັນຫາຕ່າງໆ (Imbens and Rosenbaum 2005; Murray 2006) . ວິທີການຫນຶ່ງທີ່ຈະຄິດກ່ຽວກັບບັນຫາທີ່ມີເຄື່ອງມືອ່ອນແອແມ່ນວ່າ \(\widehat{\text{CACE}}\) ສາມາດຮູ້ສຶກເຖິງການອະຄະຕິຂະຫນາດນ້ອຍໃນ \(\widehat{\text{ITT}_Y}\) -potentially ເນື່ອງຈາກ ການລະເມີດຂອງການຈໍາກັດການຍົກເວັ້ນ - ເພາະວ່າຄວາມບໍ່ສະເຫມີພາບເຫລົ່ານີ້ໄດ້ຮັບການຂະຫຍາຍໂດຍຂະຫນາດເລັກ \(\widehat{\text{ITT}_W}\) (ເບິ່ງ \(\widehat{\text{ITT}_W}\) ). ປະມານ, ຖ້າການປິ່ນປົວທີ່ທໍາມະຊາດບໍ່ໄດ້ມີຜົນກະທົບອັນໃຫຍ່ຫຼວງຕໍ່ການປິ່ນປົວທີ່ທ່ານຕ້ອງການ, ຫຼັງຈາກນັ້ນ, ທ່ານຈະໄດ້ຮຽນຮູ້ກ່ຽວກັບການປິ່ນປົວທີ່ທ່ານສົນໃຈ.

ເບິ່ງບົດທີ 23 ແລະ 24 ຂອງ Imbens and Rubin (2015) ສໍາລັບການສົນທະນານີ້ຢ່າງເປັນທາງການ. ວິທີການເສດຖະກິດແບບດັ້ງເດີມກັບຕົວແປຄໍາສັບຕ່າງໆແມ່ນສະແດງອອກໂດຍປົກກະຕິກ່ຽວກັບການຄິດໄລ່ສົມຜົນ, ບໍ່ແມ່ນຜົນໄດ້ຮັບທີ່ເປັນໄປໄດ້. ສໍາລັບຄໍາແນະນໍາຈາກມຸມມອງອື່ນນີ້, ເບິ່ງ Angrist and Pischke (2009) , ແລະສໍາລັບການປຽບທຽບລະຫວ່າງສອງວິທີການ, ເບິ່ງພາກ 24.6 ຂອງ Imbens and Rubin (2015) . ການນໍາສະເຫນີທາງເລືອກຕົວຢ່າງທາງການບາງຢ່າງຫນ້ອຍເປັນທາງການຂອງວິທີການປ່ຽນຕົວເຄື່ອງມືແມ່ນໄດ້ສະຫນອງໃຫ້ຢູ່ໃນພາກ 6 ຂອງ Gerber and Green (2012) . ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມກ່ຽວກັບການຈໍາກັດການປະຕິເສດ, ເບິ່ງ D. Jones (2015) . Aronow and Carnegie (2013) ອະທິບາຍຊຸດສົມມຸດຕິຖານເພີ່ມເຕີມທີ່ສາມາດນໍາໃຊ້ເພື່ອປະເມີນ ATE ແທນທີ່ຈະເປັນ CACE. ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມກ່ຽວກັບວິທີການທົດລອງແບບທໍາມະຊາດສາມາດເຮັດໃຫ້ມີຄວາມຫຍຸ້ງຍາກໃນການຕີຄວາມຫມາຍ, ເບິ່ງ Sekhon and Titiunik (2012) . ສໍາລັບການແນະນໍາທົ່ວໄປກ່ຽວກັບການທົດລອງແບບທໍາມະຊາດ - ຫນຶ່ງທີ່ນອກເຫນືອຈາກຕົວແປຄໍາສັບທີ່ນໍາໃຊ້ຍັງລວມມີການອອກແບບເຊັ່ນ: ການຖອນ regression - ເບິ່ງ Dunning (2012) .