הערות מתמטיות

בנספח זה, אני יסכם כמה רעיונות על היכרות סיבתית בין נתונים שאינם ניסיוניים בצורה קצת יותר מתמטית. ישנן שתי גישות עיקריות: מסגרת הגרף הסיבתי, המקושרת ביותר עם יהודה פרל ועמיתיו, ומסגרת התוצאות הפוטנציאליות, המקושרות ביותר עם דונלד רובין ועמיתיו. אציג את מסגרת התוצאות הפוטנציאליות משום שהיא קשורה קשר הדוק יותר לרעיונות המתמטיים שבסופו של פרק 3 ו -4. לקבלת מידע נוסף על מסגרת הגרפים הסיבתי, אני ממליץ על Pearl, Glymour, and Jewell (2016) (מבוא) ) Pearl (2009) (מתקדם). לקבלת טיפול אורך הספר של היקש סיבתי המשלבת את מסגרת התוצאות הפוטנציאליות ואת מסגרת גרף סיבתי, אני ממליץ Morgan and Winship (2014) .

מטרת נספח זה היא לעזור לך לקבל בנוח עם הסימון והסגנון של התוצאות הפוטנציאליות המסורת, כך שתוכל לעבור חלק חומר טכני יותר שנכתב על נושא זה. ראשית, אתאר את מסגרת התוצאות הפוטנציאלית. לאחר מכן, אני אשתמש בו כדי להמשיך ולדון בניסויים טבעיים כמו זה של Angrist (1990) על ההשפעה של השירות הצבאי על הרווחים. נספח זה מתבסס במידה רבה על Imbens and Rubin (2015) .

מסגרת תוצאות פוטנציאליות

מסגרת התוצאות הפוטנציאליות כוללת שלושה מרכיבים עיקריים: יחידות , טיפולים ותוצאות אפשריות . כדי להמחיש את היסודות הללו, הבה נבחן גרסה מסוגננת של השאלה Angrist (1990) : מה השפעת השירות הצבאי על הרווחים? במקרה זה, אנו יכולים להגדיר את היחידות כאנשים הזכאים לטיוטת 1970 בארצות הברית, ואנו יכולים למדוד את האנשים האלה על ידי \(i = 1, \ldots, N\) . הטיפולים במקרה זה יכולים להיות "משרתים בצבא" או "לא משרתים בצבא". אני אקרא להם את תנאי הטיפול והבקרה, ואני אכתוב \(W_i = 1\) אם האדם \(i\) הוא במצב הטיפול ו \(W_i = 0\) אם האדם \(i\) נמצא במצב הבקרה. לבסוף, התוצאות הפוטנציאליות הן קשות יותר מבחינה מושגית, משום שהן כרוכות בתוצאות "פוטנציאליות"; דברים שיכולים לקרות. עבור כל אדם הזכאי לטיוטת 1970, אנו יכולים לדמיין את הסכום שהם היו מרוויחים בשנת 1978 אם הם שירתו בצבא, אשר אני אקרא \(Y_i(1)\) , ואת הסכום שהם היו מרוויחים ב 1978 אם הם לא לשרת בצבא, אשר אני אקרא \(Y_i(0)\) . במסגרת התוצאות הפוטנציאליות, \(Y_i(1)\) ו- \(Y_i(0)\) נחשבים כמויות קבועות, ואילו \(W_i\) הוא משתנה אקראי.

בחירת היחידות, הטיפולים והתוצאות היא קריטית משום שהיא מגדירה את מה שניתן - ולא ניתן ללמוד ממחקר זה. בחירת היחידות - אנשים הזכאים לטיוטת 1970 - אינה כוללת נשים, ולכן ללא הנחות נוספות, מחקר זה לא יספר לנו דבר על השפעת השירות הצבאי על נשים. החלטות לגבי איך להגדיר טיפולים ותוצאות חשובים גם כן. לדוגמה, האם הטיפול בהתעניינות יתמקד בשירות הצבאי או בלחימה? האם תוצאת הריבית היא רווח או שביעות רצון בעבודה? בסופו של דבר, בחירת היחידות, הטיפולים והתוצאות צריכה להיות מונעת על ידי המטרות המדעיות והמדיניות של המחקר.

בהתחשב בבחירות של יחידות, טיפולים ותוצאות פוטנציאליות, ההשפעה הסיבתית של הטיפול באדם \(i\) , \(\tau_i\) , היא

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]

במילים אחרות, אנו משווים כמה אדם \(i\) היה מרוויח לאחר משרת עד כמה אדם \(i\) היה מרוויח בלי לשרת. לי, eq. 2.1 היא הדרך הברורה ביותר להגדרת אפקט סיבתי, ולמרות הפשוטה ביותר, מסגרת זו (Imbens and Rubin 2015) להכללה בדרכים רבות ומעניינות (Imbens and Rubin 2015) .

כאשר משתמשים במסגרת התוצאות הפוטנציאליות, לעיתים קרובות אני מוצא את זה מועיל לכתוב טבלה המציגה את התוצאות הפוטנציאליות ואת השפעות הטיפול עבור כל היחידות (טבלה 2.5). אם אתה לא יכול לדמיין שולחן כזה עבור המחקר שלך, אז ייתכן שיהיה עליך להיות מדויק יותר בהגדרות שלך יחידות, טיפולים, ואת התוצאות האפשריות.

לוח: 2.5 לוח התוצאות הפוטנציאליות
אדם רווחים במצב הטיפול רווחים במצב שליטה אפקט הטיפול
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
מתכוון \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

כאשר אנו מגדירים את ההשפעה הסיבתית בדרך זו, אנו נתקלים בבעיה. כמעט בכל המקרים, אנחנו לא מקבלים כדי לבחון את שתי התוצאות הפוטנציאליות. כלומר, אדם מסוים או שירת או לא לשרת. לכן, אנו צופים באחת התוצאות הפוטנציאליות - \(Y_i(1)\) או \(Y_i(0)\) - אך לא את שניהם. חוסר היכולת לבחון את שתי התוצאות הפוטנציאליות הוא בעיה כה גדולה, Holland (1986) כינתה אותה " הבעיה הבסיסית של היקש סיבתי" .

למרבה המזל, כאשר אנו עושים מחקר, אין לנו רק אדם אחד; במקום זאת, יש לנו הרבה אנשים, וזה מציע דרך לעקוף את הבעיה הבסיסית של הסקה סיבתית. במקום לנסות לאמוד את השפעת הטיפול ברמת הפרט, אנו יכולים להעריך את השפעת הטיפול הממוצעת עבור כל היחידות:

\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]

משוואה זו מתבטאת עדיין במונחים של \(\tau_i\) , אשר אינם נצפים, אבל עם כמה אלגברה (eq 2.8 של Gerber and Green (2012) ), אנחנו מקבלים

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]

זה מראה כי אם אנו יכולים להעריך את התוצאה הממוצעת של האוכלוסייה תחת טיפול ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) ואת התוצאה הממוצע האוכלוסייה תחת שליטה ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) , אזי ניתן לאמוד את השפעת הטיפול הממוצעת, גם מבלי להעריך את השפעת הטיפול עבור אדם מסוים.

עכשיו, אחרי שהגדרתי את האומדן שלנו - את מה שאנחנו מנסים להעריך - אני אפנה איך נוכל באמת להעריך את זה עם הנתונים. וכאן אנו רצים ישירות לתוך הבעיה שאנחנו רק לצפות אחד התוצאות הפוטנציאליות עבור כל אדם; אנו רואים \(Y_i(0)\) או \(Y_i(1)\) (טבלה 2.6). אנו יכולים להעריך את השפעת הטיפול הממוצע על ידי השוואת ההכנסות של אנשים אשר שימשו את הרווחים של אנשים שלא משרתים:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]

שבו \(N_t\) ו- \(N_c\) הם מספר האנשים בתנאי הטיפול והבקרה. גישה זו תפעל היטב אם מטלת הטיפול היא עצמאית של תוצאות פוטנציאליות, מצב המכונה לפעמים בורות . למרבה הצער, בהעדר ניסוי, בורות לא מרוצה לעתים קרובות, כלומר, האומדן ב eq. 2.4 לא צפוי לייצר הערכה טובה. אחת הדרכים לחשוב על זה היא כי בהעדר הקצאה אקראית של טיפול, eq. 2.4 הוא לא משווה כמו עם; זה משווה את הרווחים של סוגים שונים של אנשים. או ביטוי שונה במקצת, ללא הקצאה אקראית של הטיפול, הקצאת הטיפול קשורה כנראה לתוצאות פוטנציאליות.

בפרק 4, אתאר כיצד ניסויים מבוקרים אקראיים יכולים לסייע לחוקרים לבצע הערכות סיבתיות, וכאן אתאר כיצד חוקרים יכולים לנצל ניסויים טבעיים, כגון טיוטת הלוטו.

לוח 2.6: לוח התוצאות הנצפות
אדם רווחים במצב הטיפול רווחים במצב שליטה אפקט הטיפול
1 ? \(Y_1(0)\) ?
2 \(Y_2(1)\) ? ?
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) ? ?
מתכוון ? ? ?

ניסויים טבעיים

גישה אחת לביצוע הערכות סיבתיות ללא הפעלת ניסוי היא לחפש משהו שקורה בעולם, אשר העניק לך טיפול אקראי. גישה זו נקראת ניסויים טבעיים . במצבים רבים, למרבה הצער, הטבע אינו מספק באופן אקראי את הטיפול הרצוי לאוכלוסיית העניין. אבל לפעמים, הטבע באופן אקראי מספק טיפול בנושא. בפרט, אני אשקול את המקרה שבו יש איזה טיפול משני המעודד אנשים לקבל את הטיפול העיקרי . לדוגמה, הטיוטה יכולה להיחשב טיפול משני שהוקצה באופן אקראי, אשר עודדה כמה אנשים לקחת את הטיפול העיקרי, אשר שירת בצבא. עיצוב זה נקרא לפעמים עיצוב עידוד . ושיטת הניתוח שאתאר כדי לטפל במצב זה נקראת לעתים משתנים אינסטרומנטליים . במסגרת זו, עם כמה הנחות, החוקרים יכולים להשתמש בעידוד כדי ללמוד על ההשפעה של הטיפול העיקרי עבור קבוצה מסוימת של יחידות.

כדי לטפל בשני הטיפולים השונים - העידוד והטיפול הראשוני - אנחנו זקוקים לסימון חדש. נניח כי כמה אנשים מנוסחים באופן אקראי ( \(Z_i = 1\) ) או לא מנוסח ( \(Z_i = 0\) ); במצב זה, \(Z_i\) מכונה לעתים מכשיר .

בין אלה שגויסו, חלקם שימשו ( \(Z_i = 1, W_i = 1\) ) וחלקם לא ( \(Z_i = 1, W_i = 0\) ). כמו כן, בין אלה שלא גויסו, חלקם שימשו ( \(Z_i = 0, W_i = 1\) ) וחלקם לא ( \(Z_i = 0, W_i = 0\) ). את התוצאות הפוטנציאליות של כל אדם ניתן כעת להרחיב כדי להראות את מעמדם הן לעידוד והן לטיפול. לדוגמה, תן \(Y(1, W_i(1))\) להיות הרווחים של האדם \(i\) אם הוא גויס, כאשר \(W_i(1)\) הוא מצב השירות שלו אם הוא מנוסח. יתר על כן, אנו יכולים לפצל את האוכלוסייה לארבע קבוצות: מתלוננים, לא נוטלים, המגינים, ותמיד נוטלים (טבלה 2.7).

לוח 2.7: ארבעה סוגי אנשים
סוּג שירות אם מנסח שירות אם לא מנוסח
מתלוננים כן, \(W_i(Z_i=1) = 1\) לא, \(W_i(Z_i=0) = 0\)
אף פעם לא נוטשים לא, \(W_i(Z_i=1) = 0\) לא, \(W_i(Z_i=0) = 0\)
מגינים לא, \(W_i(Z_i=1) = 0\) כן, \(W_i(Z_i=0) = 1\)
תמיד נוטשים כן, \(W_i(Z_i=1) = 1\) כן, \(W_i(Z_i=0) = 1\)

לפני שנדון באומדן השפעת הטיפול (כלומר, בשירות הצבאי), נוכל להגדיר תחילה שתי השפעות של העידוד (כלומר, גיוס). ראשית, ניתן להגדיר את השפעת העידוד על הטיפול הראשוני. שנית, ניתן להגדיר את השפעת העידוד על התוצאה. יתברר כי שתי השפעות אלה ניתן לשלב כדי לספק הערכה של ההשפעה של הטיפול על קבוצה מסוימת של אנשים.

ראשית, ניתן לקבוע את ההשפעה של העידוד על הטיפול לאדם \(i\)

\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]

יתר על כן, כמות זו יכולה להיות מוגדרת על פני האוכלוסייה כולה

\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]

לבסוף, אנו יכולים להעריך \(\text{ITT} _{W}\) באמצעות נתונים:

\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]

שבו \(\bar{W}^{\text{obs}}_1\) הוא שיעור הטיפול שנצפה עבור אלו שעודדו ו \(\bar{W}^{\text{obs}}_0\) הוא שיעור הטיפול שנצפה בקרב אלו שלא קיבלו עידוד. \(\text{ITT}_W\) נקרא לעתים גם קצב ספיגה .

הבא, את ההשפעה של עידוד על התוצאה ניתן להגדיר לאדם \(i\) כמו:

\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]

יתר על כן, כמות זו יכולה להיות מוגדרת על פני האוכלוסייה כולה

\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]

לבסוף, אנו יכולים להעריך \(\text{ITT}_{Y}\) באמצעות נתונים:

\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]

שבו \(\bar{Y}^{\text{obs}}_1\) היא התוצאה הנצפית (למשל, רווחים) עבור אלו שעודדו (למשל, מנוסחים) ו \(\bar{W}^{\text{obs}}_0\) היא התוצאה הנצפית עבור אלה שלא עודדו.

לבסוף, אנו מפנים את תשומת לבנו להשפעת הריבית: השפעת הטיפול הראשוני (למשל, שירות צבאי) על התוצאה (למשל, רווחים). למרבה הצער, מתברר כי לא ניתן, באופן כללי, להעריך את ההשפעה על כל היחידות. עם זאת, בהנחות מסוימות, החוקרים יכולים להעריך את השפעת הטיפול על המתלוננים (כלומר, אנשים שישרתו אם יגויסו ואנשים שלא ישרתו אם לא יגויסו, טבלה 2.7). אני אקרא את האומדן הזה ואת ההשפעה הסיבתית הממוצעת השכיחה (CACE) (הנקראת גם אפקט הטיפול המקומי הממוצע , LATE):

\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]

שבו \(G_i\) תורמת את קבוצת האדם \(i\) (ראה טבלה 2.7) ו- \(N_{\text{co}}\) הוא מספר הציות. במילים אחרות, eq. 2.11 משווה את הרווחים של Compliers אשר מנוסחים \(Y_i(1, W_i(1))\) ולא מנוסח \(Y_i(0, W_i(0))\) . האמידה ב eq. 2.11 קשה לאמוד מהנתונים שנצפו כי לא ניתן לזהות מתלוננים תוך שימוש בנתונים נצפים בלבד (כדי לדעת אם מישהו הוא מתלונן אתה צריך לבדוק אם הוא שירת כאשר ניסח והאם הוא שירת כאשר לא מנוסח).

מתברר, במידת מה, כי אם יש ציות, אז בתנאי אחד עושה הנחות נוספות, ניתן להעריך CACE מן הנתונים הנצפים. ראשית, יש להניח שהמטלה לטיפול היא אקראית. במקרה של טיוטת הלוטו זה סביר. עם זאת, בכמה הגדרות שבהן ניסויים טבעיים אינם מסתמכים על אקראיות פיזית, הנחה זו עשויה להיות בעייתית יותר. שנית, יש להניח כי הם לא defiers (הנחה זו מכונה לעתים גם את ההנחה מונוטוניות). במסגרת הטיוטה נראה סביר להניח שיש מעט מאוד אנשים שלא ישרתו אם יגויסו וישרתו אם לא ינוסחו. שלישית, ולבסוף, מגיע ההנחה החשובה ביותר שנקראת הגבלת ההדרה . תחת הגבלת ההדרה, יש להניח כי כל ההשפעה של הקצאת הטיפול מועברת דרך הטיפול עצמו. במילים אחרות, יש להניח כי אין השפעה ישירה של עידוד על התוצאות. במקרה של טיוטת ההגרלה, למשל, יש להניח שלטיוטת הסטטוס אין השפעה על הרווחים אלא על ידי השירות הצבאי (איור 2.11). הגבלת ההדרה עלולה להיות מופרת אם, למשל, אנשים שגויסו בילו יותר זמן בבית הספר כדי להימנע משירות או אם המעסיקים היו נוטים פחות לשכור אנשים שגויסו.

איור 2.11: הגבלת ההדרה מחייבת כי לעידוד (טיוטת הגרלה) יש השפעה על התוצאה (רווחים) רק באמצעות הטיפול (שירות צבאי). הגבלת ההדרה עלולה להיות מופרת אם, למשל, אנשים שגויסו בילו יותר זמן בבית הספר כדי להימנע משירות, וכי זמן זה גדל בבית הספר הובילה לרווחים גבוהים יותר.

איור 2.11: הגבלת ההדרה מחייבת כי לעידוד (טיוטת הגרלה) יש השפעה על התוצאה (רווחים) רק באמצעות הטיפול (שירות צבאי). הגבלת ההדרה עלולה להיות מופרת אם, למשל, אנשים שגויסו בילו יותר זמן בבית הספר כדי להימנע משירות, וכי זמן זה גדל בבית הספר הובילה לרווחים גבוהים יותר.

אם אלה שלושה תנאים (הקצאה אקראית לטיפול, לא defiers, ואת הגבלת הרחקה) מתקיימים, אז

\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]

כך שנוכל לאמוד את CACE:

\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]

אחת הדרכים לחשוב על CACE היא שזה ההבדל בתוצאות בין אלו שעודדו לבין אלו שלא עודדו, מנופחים על ידי קצב ספיגה.

יש לזכור שתי אזהרות חשובות. ראשית, הגבלת ההדרה היא הנחה חזקה, והיא צריכה להיות מוצדקת על בסיס כל מקרה לגופו, אשר לעתים קרובות דורש מקצוע בתחום הנושא. הגבלת ההדרה אינה יכולה להיות מוצדקת באקראי של העידוד. שנית, אתגר מעשי משותף עם ניתוח משתנה אינסטרומנטלי מגיע כאשר לעידוד יש השפעה מועטה על ספיגת הטיפול (כאשר \(\text{ITT}_W\) הוא קטן). זה נקרא מכשיר חלש , והוא מוביל למגוון בעיות (Imbens and Rosenbaum 2005; Murray 2006) . אחת הדרכים לחשוב על הבעיה עם מכשירים חלשים היא ש- \(\widehat{\text{CACE}}\) יכול להיות רגיש להטיות קטנות ב- \(\widehat{\text{ITT}_Y}\) כנראה בשל הפרות של הגבלת ההדרה - מכיוון שהטיות אלה גדלות על ידי \(\widehat{\text{ITT}_W}\) (ראה סעיף 2.13). בערך, אם את הטיפול כי הטבע מקצה אין השפעה גדולה על הטיפול שאכפת לך, אז אתה הולך להיות קשה ללמוד על הטיפול שאכפת לך.

ראה פרק 23 ו 24 של Imbens and Rubin (2015) לגירסה רשמית יותר של דיון זה. הגישה האקונומטית המסורתית למשתנים אינסטרומנטליים מתבטאת בדרך כלל במונחים של אמידת משוואות, ולא תוצאות אפשריות. להקדמה מנקודת מבט אחרת זו, ראו Angrist and Pischke (2009) , ולהשוואה בין שתי הגישות ראו סעיף 24.6 של Imbens and Rubin (2015) . מצגת אלטרנטיבית, מעט פחות פורמלית, של גישת המשתנים האינסטרומנטליים, מובאת בפרק 6 של Gerber and Green (2012) . למידע נוסף על הגבלת ההדרה, ראו D. Jones (2015) . Aronow and Carnegie (2013) מתארים קבוצה נוספת של הנחות שניתן להשתמש בהן לאמידת ATE ולא ל- CACE. לקבלת מידע נוסף על איך ניסויים טבעיים יכול להיות מסובך מאוד לפרש, ראה Sekhon and Titiunik (2012) . עבור מבוא כללי יותר לניסויים טבעיים - אחד החורג מעבר לגישת המשתנים האינסטרומנטליים, כולל גם עיצובים כגון רגרסיה של רציפות - ראה Dunning (2012) .