Matemaatilised märkmed

See tõlge loodi arvuti. ×

Matemaatilised märkmed

Selles lisas lisan mõnevõrra matemaatilise vormi mõningaid mõtteid põhjusliku seostuse tegemise kohta mitte-eksperimentaalsetest andmetest. On kaks peamist lähenemist: põhjuslike graafikute raamistik, mis on kõige enam seotud Judea Pearli ja kolleegidega, ja potentsiaalsete tulemuste raamistik, mis on kõige enam seotud Donald Rubiniga ja kolleegidega. Ma tutvustan potentsiaalsete tulemuste raamistikku, sest see on tihedamalt seotud 3. ja 4. peatüki lõpus olevate matemaatiliste märkmetega seotud ideedega. Põhjalikumalt ka põhjuslike graafikute raamistikus soovitame Pearl, Glymour, and Jewell (2016) (sissejuhatav ) ja Pearl (2009) (arenenud). Ma soovitan Morgan and Winship (2014) põhjusliku seletuse pikkuse käsitlemist, mis ühendab potentsiaalsete tulemuste raamistiku ja põhjusliku graafiku raamistiku.

Selle lisa eesmärk on aidata teil rahul olla potentsiaalsete tulemuste traditsiooni märkusega ja stiiliga, et saaksite üle minna mõnele sellele teemale kirjutatud tehnilisemale materjalile. Esiteks kirjeldan potentsiaalsete tulemuste raamistikku. Siis ma kasutan seda, et edasi arutada loodusläbirääkimiste katseid, nagu Angrist (1990) käsitleb sõjaväeteenistuse mõju tuludele. See lisa tugineb suuresti Imbens and Rubin (2015) .

Võimalike tulemuste raamistik

Võimalike tulemuste raamistikus on kolm peamist elementi: üksused , raviviisid ja potentsiaalsed tulemused . Nende elementide illustreerimiseks kaalume Angrist (1990) esitatud küsimuse stiliseeritud versiooni: Milline on sõjaväeteenistuse mõju tuludele? Sellisel juhul võime määratleda, millised üksused on 1970. aasta eelnõu jaoks sobivad inimesed Ameerika Ühendriikides, ja me saame neid inimesi indekseerida $i = 1, \ldots, N$ . Selles olukorras võib ravi olla "sõjaväe teenimine" või "sõjaväe teenimine". Ma kutsun neid ravivõimalusi ja kontrolli tingimusi ning kirjutan $W_i = 1$ kui inimene $i$ on $W_i = 0$ ja $W_i = 0$ kui inimene $i$ on kontrolli tingimustes. Lõpuks on potentsiaalsed tulemused mõnevõrra kontseptuaalselt keerukad, kuna need hõlmavad potentsiaalseid tulemusi; asju, mis võisid juhtuda. Iga 1970. aasta eelnõu jaoks kõlbliku isiku puhul võime ette kujutada seda summat, mida nad oleksid teeninud 1978. aastal, kui nad teeniksid sõjaväes, mida ma nimetan $Y_i(1)$ ja summa, mida nad oleksid teeninud 1978, kui nad ei teeninud sõjaväelasena, mida ma kutsun $Y_i(0)$ . Võimalike tulemuste raamistikus käsitletakse $Y_i(1)$ ja $Y_i(0)$ fikseeritud kogustes, $W_i$ on juhusliku muutuja.

Üksuste valik, ravi ja tulemused on kriitilise tähtsusega, kuna see määratleb uuringu põhjal võimalikke ja neid ei saa õppida. 1970-ndate eelnõude jaoks sobivate üksuste valik ei hõlma naisi ja seega ei anna see uuring täiendavatest eeldustest meile mingit teavet sõjaväeteenistuse mõju kohta naistele. Olulised on ka otsused ravi ja tulemuste määratlemise kohta. Näiteks kas huvide käsitlemine peaks keskenduma sõjaväe teenimisele või võitlusele? Kas huvipakkuva tulu või tööga rahulolu tulemuseks peaks olema? Lõppkokkuvõttes peaks üksuste, raviviiside ja tulemuste valik põhinema uuringu teaduslikel ja poliitilistel eesmärkidel.

Võttes arvesse ühikute, raviviiside ja potentsiaalsete tulemuste valikuid, on ravi põhjuslik mõju inimesele $i$ , $\tau_i$ , on

$\tau_i = Y_i(1) - Y_i(0) \qquad(2.1)$

Teisisõnu, võrdleme seda, kui palju inimene $i$ pärast teenimist teeniks, kui palju inimene $i$ oleks teeninud ilma teenimiseta. Minu jaoks ekv. 2.1 on kõige selgem viis põhjusliku mõju määratlemiseks, ja kuigi see on väga lihtne, osutub see raamistik üldistatavaks paljudele olulistele ja huvitavatele viisidele (Imbens and Rubin 2015) .

Võimalike tulemuste raamistiku kasutamisel leian, et on kasulik kirjutada välja tabel, mis näitab potentsiaalsete tulemuste ja ravivõrkude mõju kõigile üksustele (tabel 2.5). Kui te ei suuda oma uuringu jaoks ette kujutada sellist tabelit, siis peate võib-olla täpsemalt kirjeldama oma üksuste määratlusi, raviviise ja potentsiaalseid tulemusi.

Tabel 2.5: Võimalike tulemuste tabel
Inimene	Kasum rajatises	Juhatuse kasumid	Ravi mõju
1	$Y_1(1)$	$Y_1(0)$	$\tau_1$
2	$Y_2(1)$	$Y_2(0)$	$\tau_2$
$\vdots$	$\vdots$	$\vdots$	$\vdots$
$N$	$Y_N(1)$	$Y_N(0)$	$\tau_N$
Keskmine	$\bar{Y}(1)$	$\bar{Y}(0)$	$\bar{\tau}$

Selle põhjusliku mõju määratlemisel tekib siiski probleem. Peaaegu kõikidel juhtudel ei saa me mõlemat potentsiaalset tulemust jälgida. See tähendab, et konkreetne isik teenib või ei teeninud. Seepärast jälgime üks potentsiaalseid tulemusi - $Y_i(1)$ või $Y_i(0)$ kuid mitte mõlemad. Mõlema võimaliku tulemuse eiramine on selline suur probleem, mida Holland (1986) nimetas põhjusliku seose põhiprobleemiks .

Õnneks, kui teeme uuringuid, pole meil ainult üks inimene; Pigem on meil palju inimesi ja see pakub teed Põhjusliku põhjusliku põhjustaja kohta. Selle asemel, et hinnata individuaalse tasandi raviefekti, saame hinnata kõigi ühikute keskmist raviefekti :

$\text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)$

See võrrand on endiselt väljendatud $\tau_i$ , mida ei saa jälgida, vaid mõne algebraga ( Gerber and Green (2012) ), 2.8), saame

$\text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)$

See näitab, et kui me saame hinnata ravitulemuste keskmist tulemust töötlemisel ( $N^{-1} \sum_{i=1}^N Y_i(1)$ ) ja populatsiooni keskmise tulemuse kontroll ( $N^{-1} \sum_{i=1}^N Y_i(1)$ ), siis võime hinnata keskmist raviefekti, isegi ilma konkreetsele isikule raviefekti hinnata.

Nüüd, kui ma olen oma hinnangut määratlenud - asi, mida me proovime hinnata - pöördun selle poole, kuidas seda tegelikult andmeid hinnata. Ja siin me otse probleemi, et me jälgime ainult ühte potentsiaalset tulemust iga inimese jaoks; näeme kas $Y_i(0)$ või $Y_i(1)$ (tabel 2.6). Me võime hinnata keskmist raviefekti, võrreldades inimeste tulusid, kes teenisid inimesi, kes ei teeninud:

$\widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)$

kus $N_t$ ja $N_c$ on inimeste arv $N_c$ ja kontrollitingimustes. See lähenemisviis toimib hästi, kui raviviis on sõltumatu potentsiaalsetest tulemustest, mõnikord nimetatakse seda eiratavaks . Kahjuks ei ole eksperimendi puudumisel sageli täidetud ignoreeritavus, mis tähendab, et hinnang 2.4 ei anna tõenäoliselt head hinnangut. Üks võimalus seda mõelda on selles, et ravi juhusliku määramise puudumisel on eq. 2.4 ei võrrelda sarnastega; see võrdleb eri liiki inimeste sissetulekut. Või on see veidi pisut erinev, ilma juhusliku ravi määramata, on ravi eraldamine tõenäoliselt seotud potentsiaalsete tulemustega.

4. peatükis kirjeldan, kuidas juhuslikult kontrollitud eksperimendid võivad aidata teadlastel teha põhjuslikke hinnanguid, ja siin kirjeldan, kuidas teadlased saaksid kasutada looduslikke katseid, nagu eelnõu loterii.

Tabel 2.6. Täheldatud tulemuste tabel
Inimene	Kasum rajatises	Juhatuse kasumid	Ravi mõju
1	?	$Y_1(0)$	?
2	$Y_2(1)$	?	?
$\vdots$	$\vdots$	$\vdots$	$\vdots$
$N$	$Y_N(1)$	?	?
Keskmine	?	?	?

Looduslikud katsed

Üheks lähenemisviisiks põhjuslike hinnangute tegemiseks ilma eksperimendi käivitamata on otsida midagi juhuvat maailmas, mis on juhuslikult teie jaoks määranud. Seda lähenemist nimetatakse looduslikeks eksperimentideks . Kahjuks ei paku loodus paljudel juhtudel juhuslikult tööd, mida soovite huvipakkuvatele elanikele. Kuid mõnikord pakub loodus juhuslikult seotud ravi. Eriti kaalutlen ma juhtumit, kus esineb mõni teisene ravi, mis julgustab inimesi esmakordset ravi saama. Näiteks võiks eelnõu lugeda juhuslikult määratud sekundaarseks raviks, mis julgustas mõnda inimest võtma esmakordset ravi, mis teenis sõjaväes. Seda disaini nimetatakse mõnikord julgustusprojektiks . Ja analüüsi meetod, mida ma kirjeldan selle olukorraga tegelemiseks, nimetatakse mõnikord instrumentaalseks muutujateks . Selles olukorras võivad teadlased mõningate eelduste abil julgustust õppida konkreetse üksuse alamkogumi esmatasandi ravi mõjust.

Selleks, et käsitleda kahte erinevat ravi - julgustust ja esmast ravi - vajame mõnda uut märkust. Oletame, et mõned inimesed $Z_i = 1$ juhuslikult ( $Z_i = 1$ ) või ei koostata ( $Z_i = 0$ ); Selles olukorras nimetatakse $Z_i$ mõnikord instrumenti .

Neile, kes olid koostatud, teenisid mõned ( $Z_i = 1, W_i = 1$ ) ja mõned ei saanud ( $Z_i = 1, W_i = 0$ ). Neile, keda ei koostatud, teenisid mõned ( $Z_i = 0, W_i = 1$ ) ja mõned mitte ( $Z_i = 0, W_i = 0$ ). Iga inimese potentsiaalseid tulemusi saab nüüd laiendada, et näidata nende staatust nii julgustamiseks kui ka raviks. Näiteks lasta $Y(1, W_i(1))$ olla inimese $i$ tulu, kui ta oli koostatud, kus $W_i(1)$ on tema teenuse staatus, kui see on koostatud. Peale selle saame jagada elanikkonna nelja rühma: komplikud, mittetäitjad, vallandajad ja alati võõrustajad (tabel 2.7).

Tabel 2.7: Neli inimeste liiki
Tüüp	Teenus, kui see on koostatud	Teenus, kui see pole koostatud
Komplektid	Jah, $W_i(Z_i=1) = 1$	Ei, $W_i(Z_i=0) = 0$
Mitte-võtjad	Ei, $W_i(Z_i=1) = 0$	Ei, $W_i(Z_i=0) = 0$
Defiers	Ei, $W_i(Z_i=1) = 0$	Jah, $W_i(Z_i=0) = 1$
Alati ülevõtjad	Jah, $W_i(Z_i=1) = 1$	Jah, $W_i(Z_i=0) = 1$

Enne kui me arutame ravi mõjustamise (st sõjaväeteenistuse) hindamist, võime esmalt määratleda kaks julgustust (st koostamist). Esiteks võime määratleda esmase ravitava julgustuse mõju. Teiseks võime määratleda tulemuse julgustamise mõju. Tuleb selgitada, et neid kahte mõju saab kombineerida, et anda hinnang konkreetsele inimestele suunatud ravi mõju kohta.

Esiteks, inimese julgustuse mõju ravile võib määratleda inimese $i$ kui

$\text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)$

Lisaks võib seda kogust määratleda kogu elanikkonna lõikes

$\text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)$

Lõpuks võime hinnata $\text{ITT} _{W}$ andmeid kasutades:

$\widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)$

kus $\bar{W}^{\text{obs}}_1$ on jälgitavate ravivarade arv julgustatavatele inimestele ja $\bar{W}^{\text{obs}}_0$ on jälgitav ravivastus nende jaoks, kellele ei soovitata. $\text{ITT}_W$ mõnikord nimetatakse ka vastuvõtupakkumist .

Järgnevalt saab tulemuse julgustamise mõju isikule $i$ määratleda järgmiselt:

$\text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)$

Lisaks võib seda kogust määratleda kogu elanikkonna lõikes

$\text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)$

Lõpuks saame hinnata $\text{ITT}_{Y}$ andmeid kasutades:

$\widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)$

kus $\bar{Y}^{\text{obs}}_1$ on vaadeldav tulemus (nt sissetulek) neile, keda julgustatakse (nt koostatud) ja $\bar{W}^{\text{obs}}_0$ on vaadeldud tulemus neile, keda ei julgustatud.

Lõpuks pöörame me tähelepanu huvipakkuvale mõjule: esmatasandi (nt sõjaväeteenistuse) mõju tulemus (nt sissetulek). Kahjuks selgub, et seda ei saa üldiselt hinnata kõigile üksustele. Kuid mõningate eelduste korral saavad teadlased hinnata raviprotseduuri mõju komplimentidele (st inimestele, kes teenivad, kui need koostatakse, ja inimesi, kes ei teeni, kui neid ei koostata, tabel 2.7). Ma kutsun seda hinnangut keskmisest positiivsemaks (CACE) (mida mõnikord nimetatakse ka kohalikuks keskmiseks raviefektiks , LATE):

$\text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)$

kus $G_i$ annetab inimese rühma $i$ (vt tabel 2.7) ja $N_{\text{co}}$ on lugemistajate arv. Teisisõnu, ekv. 2.11 võrdleb koostatud komplimentide sissetulekut $Y_i(1, W_i(1))$ ja ei koostata $Y_i(0, W_i(0))$ . Hinnang hinnas ekv. 2.11 tundub olevat keeruline hinnata täheldatud andmetel, kuna pole võimalik tuvastada ainult täidetavaid andmeid kasutavaid kommenteoreid (selleks et teada saada, kas keegi on komplimenteeriv, peate jälgima, kas ta teenis selle koostamisel ja kas ta teenis, kui seda ei koostatud).

Selgub - mõnevõrra üllatavalt - et kui on tegemist mõnda komplikaatorit, siis juhul kui üks teeb kolm täiendavat eeldust, on CACE võimalik hinnatud vaatlusandmetest hinnata. Esiteks tuleb eeldada, et ravi määramine on juhuslik. Loterii eelnõu puhul on see mõistlik. Mõnedes kohtades, kus looduslikud eksperimendid ei tugine füüsilisele randomiseerimisele, võib see eeldus olla problemaatiline. Teiseks peate eeldama, et need ei ole takistajad (seda eeldust nimetatakse mõnikord monotonilisuse eelduseks). Eelnõu kontekstis tundub olevat mõistlik eeldada, et on väga vähe inimesi, kes ei teeni, kui nad koostatakse ja teenivad, kui neid ei koostata. Kolmandaks ja lõpuks on kõige olulisem eeldus, mida nimetatakse tõrjutuse piiramiseks . Väljajätmispiirangu alusel tuleb eeldada, et ravitööde kogu mõju viiakse läbi ravi ise. Teisisõnu tuleb eeldada, et tulemuste julgustamiseks ei ole otsest mõju. Näiteks loteriisaaja puhul tuleb eeldada, et eelnõu olemus ei mõjuta muud tulu kui sõjaväeteenistus (joonis 2.11). Välistamispiirangut võib rikkuda, kui näiteks ettevalmistatud inimesed sõidavad koolis rohkem aega, et vältida teenuse osutamist või kui tööandjad ei võta tööle vähem inimesi.

Joonis 2.11: väljajätmise piirang nõuab, et julgustamine (loterii eelnõu) mõjutab tulemust (töötasu) ainult ravi (sõjaväeteenistus) kaudu. Välistamise piirangut võib rikkuda, kui näiteks ettevalmistatud inimesed sõidavad koolis rohkem aega, et vältida teenuse osutamist, ja et see pikem aeg koolis tõi kaasa suurema sissetuleku.

Kui need kolm tingimust (juhuslikult määratud ravi, puuduvad vallandajad ja välistamispiirang) on täidetud, siis

$\text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)$

nii et saame hinnata CACE:

$\widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)$

Üks võimalus mõelda CACE-ile on see, et nende hoogustunud ja neid, keda ei julgustataks ja mille tarbimise määr on suurenenud, on tulemuste erinevus.

Pidage silmas kaht olulist hoiatust. Esiteks on väljajätmise piirang tugeva eelduse ja seda tuleb põhjendada iga üksikjuhtumi puhul eraldi, mis sageli nõuab valdkonnapõhiseid teadmisi. Väljajätmise piirangut ei saa õigustada julgustuse juhusliku jaotusega. Teiseks, instrumentaalse muutuva analüüsi jaoks on ühine praktiline väljakutse tekkinud siis, kui julgustamisel on vähene mõju ravi kasutamisele (kui $\text{ITT}_W$ on väike). Seda nimetatakse nõrgaks vahendiks ja see põhjustab erinevaid probleeme (Imbens and Rosenbaum 2005; Murray 2006) . Üks viis nõrkade vahendite probleemi lahendamiseks on see, et $\widehat{\text{CACE}}$ võib $\widehat{\text{ITT}_Y}$ väikeste kalduvuste suhtes $\widehat{\text{ITT}_Y}$ -potentsiaalselt tänu Välistamispiirangu rikkumine - kuna need eelarvamused on suurendatud väikese $\widehat{\text{ITT}_W}$ (vt 2.13). Peaaegu, kui ravist, mida see loodus annab, pole suurt mõju teie hooldatavale ravile, siis on teil raske õppida ravi kohta, mida te hoolite.

Tutvuge Imbens and Rubin (2015) peatükkidega 23 ja 24 selle arutelu formaalsema versiooni jaoks. Traditsiooniline ökonomeetriline lähenemisviis instrumentaalsete muutujate jaoks on tavaliselt väljendatud võrrandite, mitte potentsiaalsete tulemuste hindamisel. Sellest teisest perspektiivist ülevaate saamiseks vt Angrist and Pischke (2009) ning nende kahe lähenemise võrdlemist vt Imbens and Rubin (2015) 24.6. Instrumentaalsete muutujate lähenemisviisi alternatiivne, veidi vähem formaalne esitus on toodud Gerber and Green (2012) 6. peatükis. Lisateavet välistamispiirangu kohta vt D. Jones (2015) . Aronow and Carnegie (2013) kirjeldavad täiendavaid eeldusi, mida saab kasutada pigem ATE kui CACE hindamiseks. Lisateavet selle kohta, kuidas looduslikke eksperimente saab tõlgendada väga Sekhon and Titiunik (2012) , vaata Sekhon and Titiunik (2012) . Looduslike eksperimentide üldisem tutvustus - see, mis läheb kaugemale lihtsalt instrumentaalsete muutujate lähenemisest, hõlmab ka selliseid disainilahendusi nagu regressiooni katkestamine - vt Dunning (2012) .