Cov ntawv sau zauv

Kuv xav tias qhov zoo tshaj plaws los nkag siab txog cov kev sim yog qhov kev ua tau zoo (uas kuv tau tham hauv cov ntawv sau txog zauv hauv tshooj 2). Lub hauv paus ntawm qhov peev xwm ua tau muaj kev sib raug zoo rau cov tswv yim los ntawm cov qauv tsim los ntawm qhov uas kuv tau piav qhia hauv tshooj 3 (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) . Tsab ntawv no tau muab sau rau hauv ib txoj kev raws li hais tias txoj kev sib txuas lus. Qhov tseem ceeb no yog me ntsis tsis yog neeg, tab sis kuv xav tias qhov kev sib txuas ntawm kev sim thiab cov kev sim yog pab tau: nws txhais tau hais tias yog koj paub ib yam dab tsi txog qhov piv txwv ces koj paub txog cov kev sim thiab lwm tus. Raws li kuv mam li qhia hauv cov ntawv no, cov qauv kev ua tau tshwm sim tau qhia txog lub zog ntawm cov kev sim randomized rau kwv yees cov teebmeem causal, thiab nws qhia txog cov kev txwv ntawm qhov yuav ua tau nrog cov kev sim ua tau zoo kawg li.

Nyob rau hauv daim ntawv no, Kuv yuav piav qhia txog cov kev ua tau zoo, ua ib qho ntawm cov ntaub ntawv los ntawm cov ntawv sau ua zauv hauv tshooj 2 kom ua tau cov ntawv sau ntau dua. Tom qab ntawd kuv mam li qhia txog qee qhov kev pab tau zoo txog qhov kev txiav txim siab ntawm qhov kev ntsuam xyuas nruab nrab ntawm cov kev kho mob nruab nrab, nrog rau kev sib tham ntawm kev faib cov tsiaj ntawv thiab qhov sib txawv ntawm cov kwv yees. Cov ntawv appendix no hnyav ncawv rau ntawm Gerber and Green (2012) .

Cov tswv yim ua tau zoo

Yuav kom pom cov kev ua tau zoo tshaj plaws, peb rov qab mus rau Restivo thiab van de Rijt qhov kev sim kom paub txog cov nyhuv uas tau txais ib lub tsev txhab nyiaj nyob rau yav tom ntej txog Wikipedia. Cov tswv yim ua tau tshwm sim muaj peb yam tseem ceeb: cov koog tsev kawm ntawv , kev kho , thiab cov txiaj ntsim tau tshwm sim . Nyob rau hauv rooj plaub ntawm Restivo thiab tsib lub Rijt, cov koog tsev kawm ntawv tsim nyog tau txais cov neeg kho-cov neeg nyob rau saum toj 1% ntawm cov neeg pabcuam-uas tseem tsis tau txais ib lub tsev txhab nyiaj. Peb tuaj yeem ntsuas cov npe ntawm cov editors los ntawm \(i = 1 \ldots N\) . Cov kev kho mob hauv lawv cov kev sim yog "barnstar" los yog "tsis barnstar," thiab kuv mam li sau \(W_i = 1\) yog tus neeg \(i\) nyob rau hauv qhov kev kho mob thiab \(W_i = 0\) otherwise. Qhov thib peb ntawm cov qauv kev ua tau zoo yog qhov tseem ceeb tshaj: cov txiaj ntsim tau los . Cov no kuj tsis tshua xav paub ntau vim tias lawv koom nrog "cov" ua tau "-tej yam uas yuav tshwm sim. Rau txhua tus Wikipedia editor, ib tug yuav xav txog seb tus naj npawb ntawm cov duab uas nws yuav ua rau cov kev kho mob \(Y_i(1)\) ) thiab tus naj npawb uas nws yuav ua rau tus tswj hwm ( \(Y_i(0)\) ).

Nco ntsoov tias qhov kev xaiv ntawm cov koog tsev kawm ntawv, kev kho mob, thiab cov txiaj ntsim tau tshwm sim yog dab tsi uas tau kawm los ntawm qhov kev sim no. Piv txwv, tsis muaj lwm cov kev xav, Restivo thiab tsib tsib Rijt tsis hais dab tsi txog qhov teebmeem ntawm cov pob zeb ntawm tag nrho Wikipedia los yog ntawm cov kev ua tau zoo li hloov kho. Feem ntau, kev xaiv ntawm cov koog tsev kawm ntawv, kev kho mob, thiab cov txiaj ntsim tau los yuav tsum yog nyob ntawm cov hom phiaj ntawm txoj kev tshawb fawb.

Kev ua tiav cov txiaj ntsim tau tshwm sim-uas tau muab piav qhia rau hauv lub rooj 4.5-ib tus tuaj yeem txheeb xyuas qhov cuam tshuam ntawm kev kho mob rau tus neeg \(i\) li

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]

Rau kuv, qhov no yog qhov tseeb tshaj plaws los txhais cov txiaj ntsim zoo, thiab txawm hais tias yooj yim heev, qhov no lub moj khaum pauv mus rau ntau yam tseem ceeb thiab nthuav txoj hauv kev (Imbens and Rubin 2015) .

Daim Ntawv Qhia 4.5: Cov Ncauj Lus Ntawm Qhov Ua Tau
Tus neeg Kho cov kev kho mob Hloov kho hauv kev tswj hwm Kev kho mob
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
N \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
txhais tias \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

Yog hais tias peb txhais tau qhov kev coj nyob rau hauv txoj kev no, txawm li ntawd los, peb khiav mus rau qhov teeb meem. Nyob rau hauv yuav luag txhua tus neeg mob, peb tsis tuaj yeem coj los soj ntsuam ob qho tib si. Ntawd yog, ib tug Wikipedia Wikipedia tau txais ib qho barnstar los yog tsis. Yog li, peb saib ib qho ntawm cov kev ua tau zoo- \(Y_i(1)\) los yog \(Y_i(0)\) -but tsis ob leeg. Qhov tsis muaj peev xwm ua kom pom ob qho tib neeg ua tau yog qhov teeb meem loj uas Holland (1986) hu ua nws qhov teeb meem tseem ceeb ntawm kev Tsim Nyog Tshaj .

Zoo hmoo, thaum peb tabtom tshawb nrhiav, peb tsis yog muaj ib tus neeg, peb muaj neeg coob, thiab qhov no yog ib txoj hauv kev qhov teebmeem ntawm qhov teebmeem ntawm kev txiav txim siab. Ntau dua li sim xav ntsuas tus neeg mob qhov kev kho mob, peb tuaj yeem kwv yees qhov txiaj ntsim zoo li cas:

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]

Qhov no yog tseem hais rau hauv cov nqe lus ntawm \(\tau_i\) uas yog unobservable, tab sis muaj ib co algebra (Eq 2.8 ntawm Gerber and Green (2012) ) peb tau

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]

Kab zauv 4.3 qhia tau hais tias yog hais tias peb muaj peev xwm kwv yees cov pejxeem nruab nrab sij hawm nyob rau hauv kev kho mob ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) thiab cov pejxeem nruab nrab sij hawm nyob rau hauv kev tswj ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), ces peb yuav tau kwv yees qhov nruab nrab kev kho mob nyhuv, txawm tsis muaj kwv yees cov kev kho mob tshwm sim rau muaj kev tus neeg.

Tam sim no uas kuv tau txhais peb qhov kev kwv yees-qhov peb tabtom yuav kwv yees-Kuv mam li tig mus rau qhov peb yuav kwv yees tau li cas nrog cov ntaub ntawv. Kuv nyiam xav txog qhov kev sib tw no raws li qhov teeb meem ntawm qhov teeb meem (xav rov qab txog cov ntawv sau ua zauv hauv tshooj 3). Cia li xav tias peb tsis tuaj yeem xaiv qee tus neeg los mus soj ntsuam hauv cov kev kho mob thiab peb tsis tuaj yeem xaiv qee tus neeg los saib xyuas hauv kev tswj hwm, ces peb tuaj yeem kwv yees qhov txiaj ntsig ntawm txhua qhov teeb meem:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]

qhov twg \(N_t\) thiab \(N_c\) yog cov neeg ntawm cov kev kho mob thiab kev tswj cov mob. Qhov sib npaug 4.4 yog qhov sib txawv ntawm tus txhais tau tias kwv yees. Vim yog ntawm kev tsim qauv, peb paub tias thawj lub sij hawm yog qhov kev kwv yees ncaj ncees rau qhov kev txiav txim nruab nrab ntawm kev kho mob thiab lub sij hawm thib ob yog kev kwv yees tus cwj pwm tsis pub muaj kev tswj hwm.

Lwm txoj hauv kev xav txog qhov kev xaiv kom zoo li cas yog tias nws muab kev sib piv ntawm kev kho mob thiab kev tswj hwm pawg yog qhov ncaj vim tias kev sib tw ua kom qhov ob pawg yuav sib txawv. Qhov zoo li no yog qhov uas peb tau ntsuas (hais tias tus naj npawb ntawm cov kev kho hauv 30 hnub ua ntej qhov kev sim) thiab yam uas peb tsis tau ntsuas (hais tias tub los ntxhais). Qhov kev muaj peev xwm tswj kom muaj txiaj ntsig zoo ntawm ob qho tib si cai thiab tsis muaj kev cuam ​​tshuam yog qhov tseem ceeb. Xav pom lub hwj chim uas tsis siv nyiaj rau qhov tsis muaj teeb meem, cia peb xav tias kev tshawb nrhiav yav tom ntej pom tias cov txiv neej yog cov khoom ntau dua li cov poj niam. Xav tias qhov tsis zoo ntawm Kev Tshaj Tawm thiab Kev Raug De van tsib Rijt? Tsis tau. Los ntawm kev xaiv tsa, lawv tau ua kom tag nrho cov unobservables yuav muaj kev sib npaug, hauv kev xav. Qhov kev tiv thaiv ntawm qhov tsis paub tias yog tsis muaj zog, thiab nws yog ib qho tseem ceeb uas cov kev sim no txawv ntawm cov kev qhia tsis yog kev sim tau piav nyob rau hauv tshooj 2.

Ntxiv rau kev txhais cov kev kho mob rau tag nrho cov pejxeem, nws yog ib qho ua tau los txhais kev kho mob rau lub subset ntawm cov neeg. Qhov no feem ntau hu ua qhov kev kho mob nruab nrab ntawm kev kho mob (CATE). Piv txwv, nyob hauv txoj kev tshawb no los ntawm Restivo thiab van tsib Rijt, peb xav tias qhov ntawd \(X_i\) yog seb tus editor tau siab tshaj los yog qis dua tus naj npawb ntawm cov kev kho thaum 90 hnub ua ntej qhov kev sim. Ib tug yuav xam cov kev kho mob nyias ua nyias rau cov teeb thiab hnyav cov neeg kho.

Lub hauv paus ntawm qhov peev xwm ua tau zoo yog ib txoj hauv kev uas xav txog qhov txiav txim siab thiab kev sim. Txawm li cas los xij, muaj ob qho nyuaj ntxiv uas koj yuav tsum nco ntsoov. Cov kev khov kho ob qho no feem ntau lumped ua ke nyob rau hauv lub ntsiab lus Stable Unit Treatment Value Assumption (SUTVA). Thawj qhov ntawm SUTVA yog qhov kev xav tias qhov tsuas yog qhov tseem ceeb rau tus neeg \(i\) yog qhov seb tus neeg ntawd yog nyob rau hauv txoj kev kho mob lossis tswj hwm. Hauv lwm lo lus, nws yog assumed tias tus neeg \(i\) tsis cuam tshuam los ntawm txoj kev kho mob rau lwm tus neeg. Qhov no qee zaum hu ua "tsis cuam tshuam" los sis "tsis muaj qhov dej tua", thiab sau tau ua:

\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]

qhov twg \(\mathbf{W_{-i}}\) yog ib qho vector ntawm kev kho mob rau txhua tus neeg tshwj tsis yog tus neeg \(i\) . Ib txoj kev uas qhov no tuaj yeem ua txhaum yog tias qhov kev kho los ntawm ib tus tib neeg nchuav dua mus rau lwm tus neeg, zoo lossis tsis zoo. Rov qab mus rau Restivo thiab van de Rijt's xyaum ua tej yam, xav txog ob tus phooj ywg \(i\) thiab \(j\) thiab tus neeg ntawd \(i\) tau txais ib barnstar thiab \(j\) tsis. Yog hais tias \(i\) tau txais qhov barnstar causes \(j\) yuav hloov ntau dua (tawm ntawm lub siab ntawm kev sib tw) los yog hloov tsawg dua (tawm ntawm kev nkag siab ntawm kev poob siab), ces SUTVA tau raug ua txhaum. Nws tuaj yeem raug ua txhaum txoj cai yog tias qhov kev khomob muaj feem cuam tshuam ntawm tag nrho cov neeg tau txais kev kho mob. Piv txwv, yog tias Restato thiab tsib tsib Rijt tau muab tawm 1,000 lossis 10,000 barnstars tsis yog 100, qhov no yuav muaj kev cuam tshuam cov txiaj ntsig ntawm txais qhov chaw khib nyiab.

Qhov thib ob qhov teeb meem tau ua rau hauv SUTVA yog qhov kev xav tias qhov kev kho tsuas nkaus xwb yog qhov uas tus kws tshawb fawb qhia; qhov kev xav no yog qee zaum hu ua kev kho mob uas tsis muaj kev cuam tshuam los yog excludibility . Piv txwv, nyob rau hauv Restivo thiab tsib lub Rijt, nws yuav muaj qhov xwm txheej uas yog los ntawm kev muab cov neeg ua haujlwm tshawb fawb los ua cov neeg kho kom tsim nyog rau ntawm cov phab ntawv uas muaj kev tshaj tawm thiab tias nws yog nyob rau ntawm cov neeg tsim kho tshiab-tsis yog tau txais kev pabcuam- uas ua rau kev hloov hauv kev coj tus cwj pwm. Yog hais tias qhov no muaj tseeb, ces cov nyhuv ntawm cov barnstar tsis yog qhov txawv ntawm cov nyhuv ntawm cov nyob rau ntawm cov phab kho tshiab. Ntawm chav kawm, nws tsis yog tseeb yog, los ntawm ib lub tswvyim scientific, qhov no yuav tsum pom tau zoo los yog tsis zoo. Ntawd yog, koj yuav xav txog ib tus kws tshawb fawb hais tias qhov tshwm sim ntawm tau txais ib lub tsev txhab nyiaj muaj tag nrho cov kev kho mob tom qab uas ua cov pob txha. Los yog koj yuav xav txog qhov teeb meem uas qhov kev tshawb fawb xav xav cais tawm ntawm cov pob txha ntawm tag nrho cov khoom no. Ib txoj kev xav txog nws yog nug tias puas muaj dab tsi uas ua rau Gerber and Green (2012) (p.21) hu ua "kev sib txuas ntawm symmetry"? Ua lwm yam lus, puas muaj lwm yam uas tsis yog kev kho mob uas ua rau tib neeg nyob rau hauv kev kho mob thiab kev tswj cov kev mob yuav tsum tau kho kom txawv? Kev txhawj xeeb txog cov yeeb yam puas zoo yog ua li cas cov neeg mob hauv pawg tswj hwm hauv kev kho mob kom coj cov tshuaj tshuaj placebo. Ua li ntawd, cov neeg tshawb xyuas yuav tsum paub tseeb tias qhov txawv ntawm qhov ob ntawm cov mob yog cov tshuaj tiag tiag thiab tsis yog kev noj tshuaj.

Yog xav paub ntxiv txog SUTVA, saib Ntu 2.7 ntawm Gerber and Green (2012) , nqe 2.5 ntawm Morgan and Winship (2014) , thiab nqe 1.6 ntawm Imbens and Rubin (2015) .

Precision

Hauv seem dhau los, kuv tau piav qhia seb yuav kwv yees qhov kev kho mob nruab nrab. Hauv seem no, kuv mam li muab qee cov tswv yim hais txog kev sib txawv ntawm cov kev kwv yees.

Yog tias koj xav txog kev kwv yees li kev kho mob nruab nrab raws li kwv yees qhov txawv ntawm ob qho kev txhais tau tias, ces nws muaj peev xwm qhia tau tias tus qauv yuam kev ntawm qhov kev kho mob nruab nrab yog:

\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]

qhov twg \(m\) cov neeg raug xaiv los kho thiab \(Nm\) kom tswj (saib Gerber and Green (2012) , eq 3.4). Yog li, thaum xav txog cov neeg coob npaum li cas los mus kho thiab ntau npaum li cas rau kev tswj kom tswj, koj tuaj yeem pom tau tias yog \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) , ces koj xav tau \(m \approx N / 2\) , tsuav yog tus nqi ntawm kev kho mob thiab kev tswj zoo li qub. Qhov sib piv 4.6 qhia meej tias vim li cas qhov kev tsim ntawm Bond thiab cov npoj yaig ' (2012) sim txog cov teeb meem ntawm cov lus qhia txog kev pov npav rau kev xaiv tsa (daim duab 4.18) yog cov ntaub ntawv sib txawv. Nco qab tias nws muaj 98% ntawm cov neeg koom hauv kev kho mob. Qhov no txhais tau tias qhov kev coj cwj pwm nyob rau hauv kev tswj hwm tsis yog kwv yees raws li nws tau ua, uas tau txhais tau hais tias kwv yees qhov txawv ntawm txoj kev kho mob thiab kev tswj hwm tsis tau kwv yees raws li yog qhov tseeb. Yog xav paub ntxiv txog kev faib cov neeg tuaj koom nrog rau cov kev mob, nrog rau thaum cov nqi sib txawv ntawm cov neeg mob, saib List, Sadoff, and Wagner (2011) .

Thaum kawg, hauv phau ntawv nyeem, kuv tau piav tias qhov kev sib txawv ntawm kev sib txawv, uas feem ntau yog siv rau hauv kev sib txuam, yuav ua rau muaj kev sib txawv me me tshaj qhov sib txawv ntawm tus kwv yees, uas feem ntau yog siv rau ntawm cov ntsiab lus tsim. Yog hais tias \(X_i\) yog tus nqi ntawm qhov ua ntej kev kho mob, ces tus naj npawb uas peb tseem tabtom yuav kwv yees nrog rau qhov sib txawv ntawm kev sib txawv yog:

\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]

Qhov yuam kev txheem ntawm qhov ntau yog (saib Gerber and Green (2012) , ew. 4.4)

\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]

Ib tug sib piv ntawm eq. 4.6 thiab eq. 4.8 qhia tias qhov kev sib txawv ntawm kev sib txawv yuav muaj qhov yuam kev me me thaum (saib Gerber and Green (2012) , eq 4.6)

\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]

Roughly, thaum \(X_i\) \(Y_i(1)\) thiab \(Y_i(0)\) , ces koj yuav tau ntau leej kwv los ntawm kev sib txawv ntawm kev sib txawv ntawm qhov sib txawv- ntawm-txhais tau tias ib. Ib txoj kev xav txog qhov no nyob rau hauv cov ntsiab lus ntawm Restivo thiab van de Rijt qhov kev sim yog tias muaj ntau ntau yam kev hloov hauv cov neeg uas hloov, qhov no ua rau kev sib piv kev kho thiab tswj kev mob nyuab nyuab: nws yog ib qho nyuaj rau txhom tau ib tus txheeb ze cov nyhuv me me hauv cov ntaub ntawv tau txais txiaj ntsig. Tab sis yog tias koj sib txawv-tawm qhov tshwm sim ntawm qhov tshwm sim no, ces muaj ntau tsawg hloov, thiab ua rau nws yooj yim dua mus ntes cov nyhuv me.

Saib Frison and Pocock (1992) kom muaj kev sib piv ntawm qhov sib txawv ntawm kev sib txawv, sib txawv ntawm kev sib txawv, thiab ANCOVA raws li cov chaw dav dav uas muaj ntau yam kev ntsuas ua ntej kho thiab kho tom qab. Hauv particular, lawv xav kom pom zoo ANCOVA, uas kuv tsis tau them rau ntawm no. Tsis tas li ntawd, saib McKenzie (2012) rau kev sib tham txog qhov tseem ceeb ntawm ntau cov kev ntsuas tom qab kho tas.