Riyazi qeydlər

Bu tərcümə kompüter ilə yaradılmışdır. ×

Riyazi qeydlər

Bu əlavədə mən qeyri-eksperimental məlumatlardan bir qədər daha riyazi şəkildə forma çıxarmaqla bağlı bəzi fikirləri ümumiləşdirəcəyəm. İki əsas yanaşma mövcuddur: çoxu Judea Pearl və həmkarları ilə əlaqəli əsas səbəblərdən ibarət olan çərçivə çərçivəsi və ən çox Donald Rubin və həmkarları ilə əlaqəli potensial nəticələr çərçivəsi. 3-cü və 4-cü fəslin sonunda riyazi qeydlərdə fikirlərlə daha yaxından bağlı olduğundan potensial nəticələr çərçivəsini təqdim edəcəyəm. Nəticə qrafikləri çərçivəsindəki daha çox məlumat üçün Pearl, Glymour, and Jewell (2016) (introductory ) və Pearl (2009) (qabaqcıl). Potensial nəticələr çərçivəsini və cədvəl qrafiki çərçivəsini bir araya gətirən bir nəşr səbəbi ilə kitab uzunluğu müalicəsi üçün Morgan and Winship (2014) təklif edirəm.

Bu əlavənin məqsədi bu mövzuda yazılmış bəzi texniki materiallara keçid edə bilmək üçün potensial nəticələrin ənənəsinin nota və üslubuna rahatlıq gətirməkdir. Birincisi, potensial nəticələr çərçivəsini təsvir edəcəyəm. Daha sonra, mən Angrist (1990) hərbi xidmətin mənfəətə təsiri barədə təbii təcrübələri müzakirə etmək üçün istifadə edəcəyəm. Bu əlavəsi ağır şəkildə Imbens and Rubin (2015) çəkir.

Potensial nəticələr çərçivəsi

Potensial nəticələr çərçivəsində üç əsas ünsür var: vahidlər , müalicə və potensial nəticələr . Bu elementləri nümunə göstərmək üçün Angrist (1990) verilən sualın stilize bir versiyasını nəzərdən Angrist (1990) xidmətinin mənfəətə təsiri nədir? Bu vəziyyətdə, Birləşmiş Ştatlarda 1970-ci il layihəsinə uyğun insanlar olmaq üçün vahidləri müəyyən edə bilərik və biz bu insanları $i = 1, \ldots, N$ endeksleyebiliriz. Bu halda müalicə bu müalicə və nəzarət şərait zəng edəcəyik ". Hərbi xidmət deyil" "hərbi xidmət" və ya ola bilər, və mən yazmaq lazımdır $W_i = 1$ şəxs əgər $i$ müalicə vəziyyətindədir və $i$ nəzarət vəziyyətində olduqda $W_i = 0$ . Nəhayət, potensial nəticələr birbaşa konseptual çətin olur, çünki onlar "potensial" nəticələrə malikdirlər; baş verə biləcək şeylər. 1970-ci il layihəsi üçün uyğun olan hər bir şəxs üçün biz 1978-ci ildə hərbi xidmətdə olduqları halda $Y_i(1)$ məbləği və onların qazandıqları məbləği 1978-ci ildə hərbi xidmətdə olmadıqları halda, mən çağıracağam $Y_i(0)$ . Potensial nəticələr çərçivəsində $Y_i(1)$ və $Y_i(0)$ sabit miqdar sayılır, $W_i$ təsadüfi bir dəyişkəndir.

Birləşmələrin, müalicələrin və nəticələrin seçilməsi çox vacibdir, çünki tədqiqatdan öyrənə biləcək və mümkün olmayan şeyləri müəyyənləşdirir. 1970-ci ildönümü üçün uyğun olan vahidlərin seçimi qadınlara daxil deyil və əlavə ehtimal olmadan bu işdə qadınlara hərbi xidmətin təsiri barədə heç bir məlumat verməyəcəyik. Müalicələrin və nəticələrin necə müəyyənləşdirilməsi ilə bağlı qərarlar da vacibdir. Məsələn, maraqların müalicəsi hərbi xidmətdə və döyüşdə yaşamağa yönəldilməlidir? Maraqlılığın nəticəsi qazanmaq və ya işin təmin edilməsidirmi? Nəticədə, vahidlərin seçilməsi, müalicə və nəticələr işin elmi və siyasi məqsədləri ilə idarə olunmalıdır.

$\tau_i$ , müalicələrin və potensial nəticələrin seçimini nəzərə alaraq, müalicənin şəxsin $i$ , $\tau_i$

$\tau_i = Y_i(1) - Y_i(0) \qquad(2.1)$

Başqa sözlə, biz nə qədər adam müqayisə $i$ çox şəxs necə çəkdikdən sonra qazanılmış olardı $i$ xidmət olmadan qazanılmış olardı. Mənə, eq. 2.1 səbəbə təsirini müəyyənləşdirmək üçün ən aydın bir yoldur və çox sadə olsa da, bu çərçivə çox vacib və maraqlı yollarla ümumiləşdirilə bilər (Imbens and Rubin 2015) .

Potensial nəticələr çərçivəsindən istifadə edərkən, mən çox vaxt bütün birləşmələr üçün potensial nəticələr və müalicə effektlərini göstərən bir cədvəl yazmaq faydalı olur (2.5-cü cədvə). İşiniz üçün belə bir cədvəl təsəvvür edə bilmirsinizsə, o zaman birləşmələrinizin, müalicə və potensial nəticələrinizin müəyyənləşdirilməsində daha dəqiq olmalıdır.

Cədvəl 2.5: Potensial nəticələr cədvəli
Şəxs	Müalicə vəziyyətində mənfəət	Nəzarət vəziyyətində mənfəət	Müalicə təsiri
1	$Y_1(1)$	$Y_1(0)$	$\tau_1$
2	$Y_2(1)$	$Y_2(0)$	$\tau_2$
$\vdots$	$\vdots$	$\vdots$	$\vdots$
$N$	$Y_N(1)$	$Y_N(0)$	$\tau_N$
Artıq	$\bar{Y}(1)$	$\bar{Y}(0)$	$\bar{\tau}$

Ancaq bu şəkildə nəyin səbəb olduğunu təsvir edərkən bir problemlə qarşılaşırıq. Demək olar ki, bütün hallarda, həm potensial nəticələrə riayət etməyəcəyik. Yəni müəyyən bir şəxs ya xidmət etmiş, ya da xidmət etməmişdir. Buna görə də, potensial nəticələrdən birinə - $Y_i(1)$ və ya $Y_i(0)$ - həm də ikisi deyil. Hər iki potensial nəticəni müşahidə etmək mümkünsüzdür, Holland (1986) onu Nəticə çıxarılmasının əsas problemi adlandırdığı belə böyük bir problemdir.

Xoşbəxtlikdən, tədqiqat apararkən, yalnız bir insana malik deyilik; Əksinə, biz bir çox insana sahibik və bu, Causal İnvestisiya Fundamental Problem ətrafında bir yol təqdim edir. Fərdi səviyyəli müalicə effektini qiymətləndirməyə çalışmaq əvəzinə, bütün vahidlərin orta müalicə effektini qiymətləndirə bilərik:

$\text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)$

Bu tənlik hələ $\tau_i$ olan $\tau_i$ baxımından ifadə edilir, lakin bəzi cəbr ilə $\tau_i$ Gerber and Green (2012) 2.8)

$\text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)$

Bu ki, biz müalicə altına əhalinin orta nəticəsini qiymətləndirmək olar, əgər (göstərir $N^{-1} \sum_{i=1}^N Y_i(1)$ və nəzarəti altında əhalinin orta nəticəsi () $N^{-1} \sum_{i=1}^N Y_i(1)$ ), sonra hər hansı bir şəxs üçün müalicə effektini qiymətləndirmədən, orta müalicə effektini qiymətləndirə bilərik.

İndi etdiyimiz təsəvvürləri müəyyən etdik ki, biz qiymətləndirməyə çalışdığımız şey - məlumatları necə qiymətləndirəcəyimizə dönəcəyəm. Burada biz hər bir insanın potensial nəticələrindən yalnız birini müşahidə etdiyimiz problemə birbaşa müraciət edirik; biz ya $Y_i(0)$ və ya $Y_i(1)$ (cədvəl 2.6) $Y_i(1)$ . Biz xidmət etməyən insanların mənfəətinə xidmət edən insanların gəlirlərini müqayisə edərək, orta müalicə effektini qiymətləndirə bilərik:

$\widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)$

burada $N_t$ və $N_c$ müalicə və nəzarət şəraitində olan insanların $N_c$ . Bu yanaşma, müalicənin təyin olunması potensial nəticələrdən asılı olduqda yaxşı işləyəcəkdir, bəzən isə cahilliyə çağırılmış bir vəziyyətdir. Təəssüf ki, bir təcrübə olmadıqda, cahilliyin tez-tez yerinə yetirilməməsi, yəni eq. 2.4 yaxşı qiymətləndirmək mümkün deyil. Bu barədə fikirləşməyin bir yolu, müalicənin təsadüfi təyin olunmaması halında, eq. 2.4 kimi deyil; bu, müxtəlif növ insanların gəlirlərini müqayisə edir. Yoxsa müalicənin təsadüfi təyin edilməsi olmadan bir az fərqlənirsə, müalicənin ayrılması ehtimal potensial nəticələrlə bağlıdır.

Fəsil 4-də təsadüfi yoxlamalı təcrübələrin tədqiqatçıların nəyə əsasən qiymətləndirmələr aparmasına kömək edə biləcəyini təsvir edəcəyəm və burada tədqiqatçılar lotereyanın layihəsi kimi təbii təcrübələrdən necə istifadə edə biləcəyini təsvir edəcəyəm.

Cədvəl 2.6: Gözlənilən nəticələr cədvəli
Şəxs	Müalicə vəziyyətində mənfəət	Nəzarət vəziyyətində mənfəət	Müalicə təsiri
1	?	$Y_1(0)$	?
2	$Y_2(1)$	?	?
$\vdots$	$\vdots$	$\vdots$	$\vdots$
$N$	$Y_N(1)$	?	?
Artıq	?	?	?

Təbii eksperimentlər

Eksperimentə başlamayan səbəb təxminlərini etmək üçün bir yanaşma, dünyada rastgele bir müalicə təyin edən bir şeyin aranmasıdır. Bu yanaşma təbii təcrübələr adlanır. Çox hallarda, təəssüf ki, təbiət, maraq əhalisinə istədiyiniz təsadüfi müalicəni təmin etmir. Bəzən təbiət təsadüfi bir müalicə təmin edir. Xüsusilə, insanların əsas müalicəni qəbul etməyə təşviq edən bir sıra orta müalicə olduğu halda işi nəzərdən keçirəcəyəm. Məsələn, layihənin təsadüfi olaraq təyin edilmiş ikinci bir müalicə hesab edilə bilər ki, bu da bəzi insanların hərbi xidmətdə olan əsas müalicəni aparmasına kömək edir. Bu dizayn bəzən təşviq dizaynı adlanır. Və bu vəziyyəti idarə etmək üçün təsvir edəcəyəm ki, təhlil üsulu bəzən instrumental dəyişənlər adlanır. Bu şəraitdə, bəzi fərziyyələrlə, tədqiqatçılar birləşmələrin müəyyən bir alt qrupu üçün əsas müalicənin təsirini öyrənmək üçün təşviqdən istifadə edə bilərlər.

İki müxtəlif müalicəni - təşviq və əsas müalicəni idarə etmək üçün yeni bir nota lazımdır. Bəzi insanlar təsadüfi olaraq tərtib $Z_i = 1$ ( $Z_i = 1$ ) və ya tərtib edilmədi ( $Z_i = 0$ ); bu vəziyyətdə $Z_i$ bəzən bir alət deyilir.

Hazırlananlar arasında bəziləri ( $Z_i = 1, W_i = 1$ ) və bəziləri ( $Z_i = 1, W_i = 0$ . Eyni şəkildə, hazırlanmayanlar arasında bəziləri ( $Z_i = 0, W_i = 1$ etdilər və bəziləri ( $Z_i = 0, W_i = 0$ . Hər bir şəxs üçün potensial nəticələr artıq təşviq və müalicə üçün öz statuslarını göstərmək üçün genişləndirilə bilər. Məsələn, $Y(1, W_i(1))$ $i$ əgər hazırlanmışsa $W_i(1)$ onun xidmət statusu olduğu halda, $i$ şəxsin qazandığı gəlir. Bundan əlavə, biz populyarları dörd qrupa bölə bilərik: komponentlər, əsla-rəniz, defiers və həmişəlik (cədvəl 2.7).

Cədvəl 2.7: Dörd insanın növləri
Tipi	Xidmət əgər tərtib olunarsa	Xidmət əgər hazırlanmadı
Komponentlər	Bəli, $W_i(Z_i=1) = 1$	Xeyr, $W_i(Z_i=0) = 0$
Heç vaxt olmur	Xeyr, $W_i(Z_i=1) = 0$	Xeyr, $W_i(Z_i=0) = 0$
Defiers	Xeyr, $W_i(Z_i=1) = 0$	Bəli, $W_i(Z_i=0) = 1$
Always-takers	Bəli, $W_i(Z_i=1) = 1$	Bəli, $W_i(Z_i=0) = 1$

Müalicənin təsirini (yəni, hərbi xidmət) qiymətləndirməyi müzakirə etməzdən öncə ilk növbədə təşviqatın iki təsirini (yəni hazırlanmaq) müəyyən edə bilərik. Birincisi, biz əsas müalicəyə təşviq təsirini müəyyən edə bilərik. İkincisi, təşviq nəticəsinin nəticəsini təsbit edə bilərik. Bu iki təsirin müalicənin müəyyən bir qrupa təsirinin qiymətləndirilməsi üçün birləşdirilə biləcəyi ortaya çıxacaq.

Birincisi, müalicəyə dair təşviqin təsiri şəxs kimi $i$ müəyyən edilə bilər

$\text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)$

Bundan əlavə, bu miqdar bütün əhali üzərində müəyyən edilə bilər

$\text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)$

Nəhayət, məlumatları istifadə edərək $\text{ITT} _{W}$ hesablaya bilərik:

$\widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)$

$\bar{W}^{\text{obs}}_1$ , təşviq edilmiş və $\bar{W}^{\text{obs}}_0$ təşviq edilməyənlər üçün müşahidə edilən müalicə nisbəti. $\text{ITT}_W$ bəzən də alış dərəcəsi adlanır.

Növbəti nəticəyə dair təşviqin təsiri şəxsin $i$ üçün aşağıdakı kimi müəyyən edilə bilər:

$\text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)$

Bundan əlavə, bu miqdar bütün əhali üzərində müəyyən edilə bilər

$\text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)$

Nəhayət, məlumatları istifadə edərək $\text{ITT}_{Y}$ hesablaya bilərik:

$\widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)$

$\bar{Y}^{\text{obs}}_1$ , təşviq edilmiş (məsələn, tərtib edilmiş) və $\bar{W}^{\text{obs}}_0$ , təşviq edilməyənlər üçün müşahidə edilən nəticədir.

Nəhayət, diqqəti maraqların təsirinə çeviririk: birinci dərəcəli müalicənin nəticəsi (məsələn, hərbi xidmət) nəticə (məsələn, mənfəət). Təəssüf ki, birinin, ümumiyyətlə, bu təsiri bütün vahidlərə qiymətləndirə bilmədiyi ortaya çıxır. Lakin, bəzi fərziyyələrlə, tədqiqatçılar müalicənin kompüterə təsirini qiymətləndirə bilərlər (yəni tərtib edildikdə xidmət verəcək insanlar və hazırlanmayanlara xidmət edən insanlar, cədvəl 2.7). Mən bu səciyyəvi ardıcıllıqla ortalama nəyə görə təsiri (CACE) (bu da bəzən yerli orta müalicə təsiri , LATE adlanır) deyirəm:

$\text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)$

$G_i$ şəxsin qrupunu $i$ $G_i$ bağışladığı (cədvəl 2.7-ə baxın) və $N_{\text{co}}$ komponentlərin sayıdır. Başqa sözlə, eq. 2.11 tərtib edilən tərtibatçıların qazanclarını müqayisə edir $Y_i(1, W_i(1))$ və tərtib edilməmişdir $Y_i(0, W_i(0))$ . Eq. 2.11 müşahidə olunan məlumatları qiymətləndirmək çətin görünür, çünki müştərilərə yalnız müşahidə olunan məlumatlardan istifadə etmək mümkün olmur (birinin tərtib edildikdə müşahidə etməsi lazım olduğunu və onun tərtib ediləcəyi zaman xidmət etmədiyini bilmək üçün).

Bir az təəccüblü olaraq ortaya çıxır ki, hər hansı bir komponent varsa, onda bir təmin edilmiş üç əlavə fərziyyə olur, CACE-ni müşahidə olunan məlumatlardan qiymətləndirmək mümkündür. Birincisi, müalicə üçün tapşırığın təsadüfi olduğunu düşünmək lazımdır. Layihə lotereyası vəziyyətində bu məqbuldur. Bununla belə, təbii təcrübələrin fiziki randomizasiyaya əsaslanmadığı bəzi hallarda bu fərziyyə daha problemli ola bilər. İkincisi, onların heç bir defieri olmadığını düşünmək lazımdır (bu ehtimal bəzən monotonizm ehtimalı adlanır). Layihə kontekstində nəzərdə tutulsa, işə yaramayan və hazırlanmayan bir yerdə xidmət verəcək az sayda insan var. Üçüncüsü, nəhayət, istisnalar məhdudiyyəti adlanan ən mühüm fərziyyə gəlir. Dışlama məhdudiyyətinə əsasən, müalicə təyinatının təsirinin bütün müalicənin özü keçdiyini qəbul etməlidir. Başqa sözlə, nəticələrə dair təşviqin birbaşa təsiri olmadığını düşünmək lazımdır. Lotereya layihəsi vəziyyətində, məsələn, layihənin statusunun hərbi xidmətdən başqa mənfəətə təsiri olmadığını qəbul etməlidir (şəkil 2.11). Məsələn, əgər hazırlanmış insanlar xidmətdən qaçınmaq üçün daha çox vaxt sərf etmişlərsə və ya işəgötürənlər hazırlanmış işəgötürənləri işə götürmək üçün daha az olsalar, istisna məhdudiyyəti pozulmalıdır.

Şəkil 2.11: İstisnasız məhdudiyyət təşviq (lotereya layihəsi) nəticədən (qazanc) yalnız müalicə (hərbi xidmət) vasitəsilə təsir göstərməsini tələb edir. Misal üçün, hazırlanmış insanlar xidmətdən qaçınmaq üçün məktəbdə daha çox vaxt sərf etmişlər və məktəbdə bu artımın daha yüksək mənfəətə gətirdikləri təqdirdə, istisna məhdudiyyəti pozulmalıdır.

Əgər bu üç şərt (müalicəyə təsadüfi təyinat, heç bir defieri və istisnalar məhdudiyyəti) yerinə yetirilirsə

$\text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)$

beləliklə CACE hesablaya bilərik:

$\widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)$

CACE haqqında düşünmək üçün bir vasitədir ki, təşviq edilmiş və təşviq olunmayanlar arasında alınma nisbətinə görə şişirdilmişlər arasındakı fərqlərdir.

Yadda saxlamaq üçün iki əhəmiyyətli xəbərdarlıq var. Birincisi, istisnaların məhdudlaşdırılması güclü bir ehtimaldır və tez-tez mövzu sahəsi təcrübəsi tələb edən hər bir halda əsasında əsaslandırılmalıdır. Dışlama məhdudlaşdırılması təşviqatın təsadüfiləşməsi ilə əsaslandırıla bilməz. İkincisi, alqı-satqı dəyişkənliyi ilə ümumi bir praktik müdaxilə təşviq müalicənin alınmasına az təsir göstərdiyində gəlir ( $\text{ITT}_W$ kiçik $\text{ITT}_W$ ). Bu zəif bir vasitədir və müxtəlif problemlərə səbəb olur (Imbens and Rosenbaum 2005; Murray 2006) . Zəif alətlərlə problemin $\widehat{\text{CACE}}$ bir yolu $\widehat{\text{CACE}}$ $\widehat{\text{ITT}_Y}$ kiçik ehtiyatlara qarşı həssas ola bilər. istisnalar məhdudiyyətinin pozulması - bu yanlışlıqlar kiçik bir $\widehat{\text{ITT}_W}$ (bax 2.13). Təbiətin verdiyi müalicə siz qayğı göstərdiyiniz müalicəyə böyük təsir göstərməsə, onda siz qayğı göstərdiyiniz müalicə haqqında öyrənmək çətin olacaq.

Bu müzakirənin daha rəsmi bir versiyası üçün Imbens and Rubin (2015) 23 və 24-cü fəslinə baxın. Instrumental dəyişənlərə ənənəvi ekonometrik yanaşma adətən, tənliklərin qiymətləndirilməsi baxımından deyil, potensial nəticələr deyil. Digər baxımdan bir təqdimat üçün Angrist and Pischke (2009) baxın Angrist and Pischke (2009) iki yanaşma arasında müqayisə etmək üçün, Imbens and Rubin (2015) 24.6) 24.6- Imbens and Rubin (2015) baxın. Gerber and Green (2012) 6-cı fəslində instrumental dəyişənlərin yanaşmasına alternativ, bir az formal təqdimat verilmişdir. Dışlama məhdudiyyəti haqqında daha ətraflı məlumat üçün, bax D. Jones (2015) . Aronow and Carnegie (2013) CACE əvəzinə ATE-nin qiymətləndirilməsi üçün istifadə edilə bilən əlavə bir təsəvvürlər təsvir edir. Təbii eksperimentlərin şərh edilməsi çox çətin ola biləcəyi barədə daha ətraflı məlumat üçün Sekhon and Titiunik (2012) bax. Təbii eksperimentlərin daha ümumi bir tətbiqi üçün - yalnız bir ardıcıl dəyişənlərin yanına gedir, həm də regresiya dayanıqlığı kimi dizaynları ehtiva edir - baxın Dunning (2012) .