Ohar matematikoak

Esperimentuak ulertzeko modurik onena emaitzen esparru potentziala da (2. kapituluko ohar matematikoetan eztabaidatu nuen). Baliabideen emaitzen esparruak 3. kapituluko (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) kapituluan) deskribatutako diseinuan oinarritutako (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) buruzko ideien arteko lotura estua du. Aplikazio hau konexio hori azpimarratu duen moduan idatzi da. Azpimarratu hau ez da tradizionala, baina uste dut laginketa eta esperimentuen arteko konexioa lagungarria dela: laginketaren inguruko zerbait ezagutzen baduzu, esperimentuei buruz zerbait dakizun eta alderantziz. Ohar hauei buruz esango dudan bezala, emaitzen esparru potentzialak azentudun kontrolatutako esperimentuen indarra agerian uzten du kausazko efektuak kalkulatzeko, eta ezin hobeki egindako esperimentuekin egin daitekeen mugak erakusten ditu.

Aplikazio honetan, emaitza-esparru posibleak deskribatuko ditut, 2 kapituluko ohar matematikoen materiala bikoiztuko da, ohar horiek norberarenak direnean. Ondoren, emaitza lagungarria azalduko dut batez besteko tratamenduaren efektuak kalkulatzeko doitasunari buruz, esleipen optimoa eta desberdintasun-desberdintasunen zenbatesleen eztabaida barne. Apartekoa Gerber and Green (2012) marrazten du.

Baliabideen emaitzen esparrua

Emaitza potentzialaren esparrua ilustratzeko, Restivo eta van de Rijt-en esperimentura itzuliko gara, Wikipediako etorkizuneko ekarpenetarako barnstar bat jasotzeko eragina kalkulatzeko. Baliabideen emaitzen esparruak hiru elementu nagusi ditu: unitateak , tratamenduak eta emaitza potentzialak . Restivo eta van de Rijten kasuan, unitateak editore merezi izan zituzten (% 1eko kontribuzio handienekoak), oraindik ez zuten barnstar bat jaso. Editore hauek indexatu ditzakegu \(i = 1 \ldots N\) . Esperimentuaren tratamenduak "barnstar" edo "barnstar" ez ziren eta \(W_i = 1\) idazten dut, \(i\) tratamendu egoera eta \(W_i = 0\) bestela. Baliabide posibleen esparruaren hirugarren elementua garrantzitsuena da: emaitza potentzialak . Hauek pixka bat gehiago dira kontzeptualki zailak direlako "potentzialak" diren emaitzak lortzeko; Wikipedia-eko editore bakoitzarentzat, tratamendu-baldintza batean ( \(Y_i(1)\) ) eginiko aldaketak imajinatu ditzakezu eta kontrol-baldintza batean ( \(Y_i(0)\) ).

Kontuan izan unitateak, tratamenduak eta emaitzak hautatzen dituztela esperimentu honetatik ikasi ahal dena. Adibidez, Restivo eta van de Rijt-ek ez du inolako hipotesi gehigarririk, eta ezingo du aipatu Wikipediaren editore guztiei edo edertasunaren kalitateari buruzko emaitzetan eragina izan. Oro har, unitateak, tratamenduak eta emaitzak aukeratu behar dira azterketaren helburuen arabera.

Emaitza potentzial hauetakoren bat dutenek, 4.5. Taulan laburbiltzen direnak, \(i\) pertsonaren tratamenduaren kausazko efektua zehazten dute

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]

Niretzat, ekuazio hau kausazko efektua zehazteko bide argiena da eta, nahiz eta oso sinplea izan, esparru hau oso modu garrantzitsu eta interesagarri bihurtzen da (Imbens and Rubin 2015) .

4.5 taula: emaitza potentzialen taula
Pertsona Tratamendu egoera baldintzatzen du Aldaketa kontrolpean Tratamendu efektua
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
N \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
esan nahi \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

Horrelako kausalitatea definitzen badugu, ordea, arazoa dugu. Ia kasu guztietan, ez dugu lortuko bi emaitza potentzialak. Hau da, Wikipediako editore espezifiko batek barnstar bat jaso du edo ez. Beraz, emaitza potentzialetako bat ikusten dugu: \(Y_i(1)\) edo \(Y_i(0)\) -besteak ez bai. Baliabide potentzialak behatzeko ezintasuna Holland (1986) arazo nagusietako bat da, kausaren inferentzia oinarrizko arazoa deitzen duena.

Zorionez, ikerketa egiten ari garenean, ez dugu pertsona bakarra, jende askok daukagunik, eta honek kausaren inferentzia oinarrizko arazoren bat eskaintzen du. Banakako tratamenduaren efektua kalkulatzeko ahalegina egin beharrean, tratamenduaren batez besteko efektua kalkulatu ahal izango dugu:

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]

Hau oraindik \(\tau_i\) ez direnean adierazten da, baina algebra batzuekin ( Gerber and Green (2012) 2.8 Eq 2.8) lortzen dugu

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]

4.3 ekuazioaren arabera, biztanleriaren batez besteko emaitza ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) eta biztanleriaren batez besteko emaitza kontrolpean ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), tratamenduaren batez besteko efektua kalkulatu ahal izango dugu, nahiz eta pertsona jakin baten tratamendu-efektua estimatu gabe.

Orain, estimazioa definitu dudanez, estimatzen saiatzen ari garen zerbait, datuen kalkulua nola egin dezakegu? Emaitzaren erronkari buruz pentsatu nahi dut, laginketa-arazo gisa (3 kapituluko ohar matematikoei buruz pentsatu). Imajinatu ausaz hautatutako pertsona batzuk tratamenduaren baldintzetan behatzea eta ausaz hautematea pertsona batzuk kontrolatzeko baldintzetan behatzea, baldintza bakoitzean batez besteko emaitza kalkulatzeko:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]

non \(N_t\) eta \(N_c\) dira tratamenduaren eta kontrolaren baldintzen artean. 4.4 ekuazioa diferentziala da. Laginketaren diseinua dela eta, lehen terminoaren tratamenduaren batez besteko emaitzen estimatzaile ezberdina da, eta bigarren terminoaren arabera, kontrolaren neurketa ezegonkorra da.

Bestalde, ausazko aukera ematen duenari buruzko beste modu bat da tratamendu eta kontrol taldeen arteko konparazioa arrazoizko dela bermatzen duela bermatzen duelako, bi taldek elkarren antza izango dutelako. Antzekoa da neurtu ditugun gauzei dagokienez (esan aldaketak aurreko 30 egunetan esperimentuaren aurretik) eta neurtu ez ditugun gauzak (generoaren arabera). Gaitasun hori faktore behatutako eta ikusitako faktoreen oreka bermatzea da. Oharkabean faktoreen orekapen automatikoaren boterea ikusteko, imajinatu etorkizuneko ikerketek gizonezkoek emakumezkoek baino sariagoak izan ditzatenela. Restivo eta van de Rijten esperimentuak baliogabetuko lituzke? N º. Ausizteari esker, ezbairik gabeko guztiak orekatuak izango lirateke, itxaropenean. Ezezagunaren aurkako babesa oso indartsua da eta esperimentuak 2 kapituluan deskribatutako teknika ez-esperimentalak ez direnak dira.

Biztanleri osoa tratatzeko eragina zehaztea gain, pertsona baten azpimultzo bat tratatzeko efektua definitu daiteke. Hau normalean baldintzazko batez besteko tratamenduaren eragina (CATE) deritzo. Adibidez, Restivo eta Van de Rijt-en azterketan, imajinatu \(X_i\) batez besteko aldizkariaren batez bestekoaren azpitik dagoen ala ez, esperimentuaren 90 egunetan zehar. Tratamenduaren efektua bereizteko argibideak eta astunak diren editore hauetakoren bat izan liteke.

Emaitza potentzialaren esparrua inferentzia kausalen eta esperimentuen inguruko pentsamendu indartsua da. Hala ere, kontuan hartu behar dituzu bi konplexutasun osagarri. Bi konplexutasun hauek maiz lotzen dira elkarrekin Unitatearen Tratamendu Balioen Asunción (SUTVA) terminoaren arabera. SUTVA lehen zatia hipotesi da horretarako pertsona gauza bakarra dagoela \(i\) k emaitza da pertsona horrek ala tratamendua edo kontrol baldintza izan zen. Beste era batera esanda, gainontzeko pertsonei emandako tratamenduek ez dutela gain hartzen \(i\) . Hau batzuetan "interferentziarik" edo "isurpenik ez" deitzen zaie, eta honela idatz daiteke:

\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]

non \(\mathbf{W_{-i}}\) tratamenduaren egoeretarako bektore bat da guztiontzat \(i\) izan ezik. Bortxakeria hori modu batean edo bestean pertsona baten tratamendua beste pertsona baten gainean jartzen bada, positiboki edo negatiboki. Restivo eta Van de Rijt-en esperimentura itzultzeko, imajinatu bi \(i\) eta \(j\) lagunak eta \(i\) barnstar bat jasotzen du eta \(j\) ez. \(i\) barnstar kausak jasotzen badituzu \(i\) \(j\) gehiago (lehiaketa zentzuan) editatu edo editatu gutxiago (etsipen zentzuan), SUTVA urratu egin da. Tratamenduaren eragina tratamendua jasotzen duten gainerako pertsonen kopuruaren araberakoa izango da. Esate baterako, Restivo eta van de Rijt-ek 10000 edo 10.000 intsulinarekin banatu badituzte 100 baino ordez, honek barnstar bat jasotzeko duen eragina eragin dezake.

Bigarren arazoa SUTVA-rekin lotua dago ikertzaileak emandako bakarra tratamendu egokia dela; Aurreikuspen hau batzuetan ez da ezkutuko tratamendu edo ezeztapenik deitzen . Esate baterako, Restivo eta van de Rijt-en kasuan, barnstar bat emanez, ikertzaileek editoreek argitaratzaileen orri ezagunetan agertzea eragin zuten eta publizitate orri ezagunetan ari zela, barnstar- editatzeko portaera aldaketa eragin zuen. Egia bada, orduan barnstararen efektua ez da ezagunen editoreen orrian egotearen ondorioa. Jakina, ez da argia, ikuspuntu zientifikotik, hau erakargarria edo ez atsegina izatea. Hori dela eta, barnstar bat jasotzeko eragina barnstar triggers ondorengo tratamendu guztiak barne hartzen duten ikertzaile bat imajinatu dezakezu. Edo, agian, ikerketa batek beste gauza hauen gaineko eragina isolatu nahi lukeen egoera batean imajinatzea. Gerber and Green (2012) (41. or.) 41. or.) "Nahasketa simetrikoan" deitzen dioten galdetzeko modu bat da pentsatzea. Beste era batera esanda, tratamendua eta kontroleko baldintza pertsonen tratamendua modu ezberdinean tratatzeko beste ezer baino ez da? Simetriaren hausturari buruzko kezkak dira pazienteen kontroleko taldeko pazienteak proba medikoetan pilula bat hartzeko. Horrela, ikertzaileek ziur egon daiteke bi baldintza horien arteko desberdintasun bakarra benetako medikua dela eta pilula hartzearen esperientzia ez dela.

SUTVAri buruzko informazio gehiago nahi izanez gero, ikus Gerber and Green (2012) 2.7 Gerber and Green (2012) atala, Morgan and Winship (2014) 2.5 atala Morgan and Winship (2014) eta Imbens and Rubin (2015) atala, 1.6.

Zehaztasun

Aurreko atalean, tratamenduaren batez besteko efektua nola kalkulatu den azaltzen dut. Atal honetan, estimazio horien aldakortasunari buruzko ideia batzuk emango ditut.

Tratamenduaren batez besteko efektua zenbaterainoko laginaren bi aldeen arteko aldea kalkulatzen dela uste baduzu, posible da tratamenduaren batez besteko efektuaren errore estandarra dela:

\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]

non \(m\) tratamenduari esleitutako pertsonak eta \(Nm\) kontrolatzeko (ikus Gerber and Green (2012) , 3.4 ekuazioa). Horrela, tratamenduari esleitutako pertsona kopurua eta zenbat kontrol esleitzeko zenbat pertsona pentsatzen duzunean, \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) , orduan \(m \approx N / 2\) , betiere tratamenduaren eta kontrolaren kostuak berdinak badira. 4.6. Ekuazioak argitu egiten du Bondek eta lankideek (2012) botoari buruzko informazio sozialaren ondorioei buruzko esperimentua (4.18 irudia) estatistikoki eraginkorra izan zela. Gogoratu tratamendu baldintza batean parte-hartzaileen% 98 izan zela. Horrek esan nahi du kontrol-kondizioaren portaera mediana ez zela zehaztasunez kalkulatu, eta ondorioz, tratamenduaren eta kontrolaren baldintzen arteko diferentzia estimatua ez zen zehatz-mehatz kalkulatu. Parte-hartzaileen baldintza hobeak lortzeko, kostuen arteko desberdintasunak baldin List, Sadoff, and Wagner (2011) ikusi List, Sadoff, and Wagner (2011) .

Azkenean, testu nagusiaren arabera, diferentzia diferentzialen zenbatesle bat, hau da, diseinu mistoak erabiltzen ohi denez, bariantz txikiagoak esan nahi du diferentzia-bitarteko zenbatesle bat baino, hau da, normalean, arteko-irakasgaietan diseinua. Baldin eta \(X_i\) tratamenduaren emaitzaren balioa bada, orduan diferentzia diferentziarekin kalkulatzen saiatzen ari garen kantitatea honako hau da:

\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]

Kantitate horren errore estandarra (ikus Gerber and Green (2012) , 4.4.

\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]

Eq konparaketa 4.6 eta eq. 4.8 agerian uzten du desberdintasunaren arteko desberdintasunak hurbileko estandar txikiagoa duela (ikusi Gerber and Green (2012) , 4.6 ekuazioa)

\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]

Gutxi gorabehera, \(X_i\) \(Y_i(1)\) eta \(Y_i(0)\) aurresuposiboak oso \(X_i\) zehatzak lortzen ditu desberdintasunetik abiatuta, bat-bat esan nahi du. Modu horretan, Restivo eta van de Rijt-en esperimentuan pentsatu beharra dago jendeak aldatzen duen kopuruaren aldakuntza natural asko dagoela, beraz, zaila egiten da tratamendua eta kontrola egiteko zailtasunak alderatzea. efektu txikia emaitza emankorreko datuetan. Baina aldakortasun naturalean gertatzen den desberdintasuna baztertzen baduzu, askoz gutxiago dago aldakortasuna, eta efektu txikia hautemateko errazagoa da.

Ikus Frison and Pocock (1992) alderdi diferentzialen, desberdintasunen arteko aldeak eta ANCOVA oinarritutako planteamenduen konparazio zehatz baterako, aurrez tratamendua eta tratamendua baino neurri handiagoak dituzten neurri orokorretan. Bereziki, oso gomendatzen dute ANCOVAk, hemen ez dut estalita. Gainera, ikusi McKenzie (2012) post-tratamenduaren emaitzen neurri anitzetako garrantziaren inguruko eztabaidarako.