Nótaí matamaitice

I mo thuairimse, is é an bealach is fearr chun turgnaimh a thuiscint ná an creat torthaí féideartha (a phlé mé sna nótaí matamaitice i gcaibidil 2). Tá dlúthchaidreamh ag an gcreat torthaí féideartha leis na smaointe ó sampláil bunaithe ar dhearadh a thuairiscigh mé i gCaibidil 3 (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) . Tá an t-aguisín seo scríofa ar bhealach a chuirfidh béim ar an nasc sin. Is beagán neamhthraidisiúnta é an bhéim seo, ach is dóigh liom go bhfuil an nasc idir sampláil agus turgnaimh cabhrach: ciallaíonn sé sin má tá a fhios agat rud éigin faoi sampláil ansin tá a fhios agat rud éigin faoi thurgnaimh agus vice versa. Mar a thaispeánfaidh mé sna nótaí seo, nochtann an creat torthaí féideartha neart na turgnaimh faoi rialú rialaithe randamach chun éifeachtaí cúiseacha a mheas, agus léiríonn sé na teorainneacha ar na rudaí is féidir a dhéanamh le turgnaimh a dhéantar go foirfe.

San aguisín seo, cuirfidh mé síos ar an gcreat torthaí féideartha, ag dúbailt cuid den ábhar ó na nótaí matamaitice i gCaibidil 2 chun na nótaí seo a dhéanamh níos mó féinfhéin. Ansin, cuirfidh mé síos ar roinnt torthaí cabhrach maidir le cruinneas na meastachán ar na héifeachtaí meánchóireála, lena n-áirítear plé ar an leithdháileadh is fearr agus na meastóirí difríochta i difríochtaí. Tarraingíonn an t-aguisín go mór ar Gerber and Green (2012) .

Creat torthaí féideartha

D'fhonn an creat torthaí féideartha a léiriú, cuirimid ar ais chuig turgnamh Restivo agus van de Rijt chun meastachán a dhéanamh ar an éifeacht a bhaineann le scéalta a fháil ar ranníocaíochtaí sa todhchaí go Vicipéid. Tá trí phríomhghné ag an gcreat torthaí féideartha: aonaid , cóireálacha , agus torthaí féideartha . I gcás Restivo agus van de Rijt, bhí na haonaid ina eagarthóirí fiúntach - iad siúd sa 1% is airde de na rannpháirtithe - nár fuair scéalta fós. Is féidir linn na n-eagarthóirí seo a innéacs trí \(i = 1 \ldots N\) . Ba iad na cóireálacha ina dturgnamh ná "barnstar" nó "no barnstar," agus scríobhfaidh mé \(W_i = 1\) má tá duine \(i\) sa riocht cóireála agus \(W_i = 0\) shlí eile. Is é an tríú eilimint den chreat torthaí féideartha an ceann is tábhachtaí: na torthaí féideartha . Tá siad seo beagán níos deacra go coincheapúil toisc go mbíonn torthaí "féideartha" acu ina leith - rudaí a d'fhéadfadh a bheith ag tarlú. Maidir le gach eagarthóir Vicipéid, is féidir ceann a shamhlú ar líon na n-athruithe a dhéanfadh sí sa riocht cóireála ( \(Y_i(1)\) ) agus an líon a dhéanfadh sí sa riocht rialaithe ( \(Y_i(0)\) ).

Tabhair faoi deara go sainíonn an rogha aonaid, cóireálacha agus torthaí seo cad is féidir a fhoghlaim ón turgnamh seo. Mar shampla, gan aon boinn tuisceana eile, ní féidir le Restivo agus van de Rijt aon ní a rá faoi éifeachtaí scéalacha ar gach eagarthóir Vicipéid nó ar thorthaí ar nós cáilíocht in eagar. Go ginearálta, ní mór rogha aonaid, cóireálacha agus torthaí a bheith bunaithe ar spriocanna an staidéir.

I bhfianaise na dtorthaí féideartha seo - a ndéantar achoimre orthu i dTábla 4.5-is féidir le duine an tionchar cúiseach a bhaineann leis an gcóireáil do dhuine \(i\) a shainmhíniú

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]

Is é an chothromóid seo an bealach is soiléire chun éifeacht cúiseach a shainmhíniú, agus, cé go bhfuil sé thar a bheith simplí, bíonn an creat seo i gceist go ginearálta i go leor bealaí tábhachtacha agus suimiúla (Imbens and Rubin 2015) .

Tábla 4.5: Tábla na dTorthaí Féideartha
Duine Athruithe i riocht cóireála Athruithe i riocht rialaithe Éifeacht cóireála
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
N \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
ciallóidh \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

Má shainmhimid cúisiúlacht ar an mbealach seo, áfach, bíonn fadhb againn. I mbeagnach gach cás, ní fheicimid na torthaí féideartha a urramú. Is é sin, fuair eagarthóir sainiúil Vicipéid scéalta nó ní hamháin. Dá bhrí sin, breathnaímid ar cheann de na torthaí féideartha- \(Y_i(1)\)\(Y_i(0)\) - níl an dá rud. Is fadhb mhór é an neamhábaltacht chun na torthaí féideartha a urramú agus d'iarr an Holland (1986) an Fadhb Bunúsach ar Thosca Cúisimh .

Ar an drochuair, nuair atá taighde á dhéanamh againn, níl aon duine amháin againn, ní mór dúinn go leor daoine, agus cuireann sé seo ar bhealach ar fud an Fadhb Bunúsach ar Thorthaí Cúisimh. Seachas iarracht a dhéanamh meastachán a dhéanamh ar an éifeacht cóireála ar leibhéal aonair, is féidir linn meastachán a dhéanamh ar an éifeacht cóireála meán:

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]

Tá sé seo in iúl fós i dtéarmaí an \(\tau_i\) nach bhfuil \(\tau_i\) , ach le roinnt ailgéabar (Eq 2.8 de Gerber and Green (2012) ) a fhaighimid

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]

Léiríonn Cothromóid 4.3 más féidir linn meastachán a dhéanamh ar thorthaí an mheáin daonra faoi chóireáil ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) agus an toradh meán daonra faoi rialú ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), ansin is féidir linn an éifeacht cóireála meán a mheas, fiú gan an éifeacht cóireála a mheas d'aon duine áirithe.

Anois go ndearna mé sainmhíniú ar ár meastachán-an rud atá á lorg againn a mheas - beidh sé ag dul go dtí conas is féidir linn meastachán a dhéanamh air i ndáiríre le sonraí. Is maith liom smaoineamh ar an dúshlán meastacháin seo mar fhadhb samplála (smaoineamh ar ais chuig na nótaí matamaitice i gcaibidil 3). Samhlaigh go roghnóimid roinnt daoine go randamach chun breathnú orthu sa riocht cóireála agus go roghnóimid roinnt daoine go randamach chun breathnú orthu sa riocht rialaithe, ansin is féidir linn meastachán a dhéanamh ar an toradh meán i ngach coinníoll:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]

i gcás inarb é \(N_t\) agus \(N_c\) líon na ndaoine sna coinníollacha cóireála agus rialaithe. Is é Cothromóid 4.4 meastóir difríochta-de-mheán. Mar gheall ar an dearadh samplála, tá a fhios againn gur meastóir neamhchlaonta é an chéad téarma maidir leis an toradh meán faoi chóireáil agus is meastachán neamhchlaonta faoi rialú é an dara téarma.

Is bealach eile chun smaoineamh ar cad é a chumasú randamach ná go gcinntíonn sé go bhfuil an chomparáid idir na grúpaí cóireála agus rialaithe cothromach toisc go gcinntíonn randamú go mbeidh an dá ghrúpa cosúil le chéile. Tá an chosúlacht seo le haghaidh rudaí a thomhasomar (deir líon na n-athruithe sna 30 lá roimh an turgnamh) agus na rudaí nach bhfuil muid tomhaiste (inscne a rá). Tá sé ríthábhachtach an cumas seo chun cothromaíocht a áirithiú ar fhachtóirí a breathnaíodh agus a bhfuil neamhsheiceáil orthu. Chun cumhacht cothromaíochta uathoibríoch a fheiceáil ar fhachtóirí gan choinne, a shamhlú go bhfaighidh taighde sa todhchaí go bhfuil fir níos freagrúil do dhámhachtainí ná do mhná. Ar mhaith go dtiocfadh torthaí an turgnamh Restivo agus van de Rijt a neamhbhailí? Uimh. Trí randamú, chinntigh siad go mbeadh gach aon neamhsheirbhíse cothromaithe, ag súil leis. Tá an chosaint seo in aghaidh anaithnid an-chumhachtach, agus is bealach tábhachtach é go bhfuil na turgnaimh difriúla ó na teicnící neamhthuirgiúla a thuairiscítear i gCaibidil 2.

Chomh maith leis an éifeacht cóireála a shainmhíniú do dhaonra ar fad, is féidir éifeacht cóireála a shainmhíniú do shínéad daoine. De ghnáth, is éard atá i gceist leis seo éifeacht cóireála meán coinníollach (CATE). Mar shampla, sa staidéar ag Restivo agus van de Rijt, suí dúinn go bhfuil \(X_i\) cibé an raibh an t-eagarthóir os cionn nó faoi bhun an meánmheán na n-athruithe i rith na 90 lá roimh an turgnamh. D'fhéadfaí amháin an éifeacht cóireála a ríomh ar leithligh le haghaidh na n-eagarthóirí solas agus trom seo.

Is bealach cumhachtach é creat na dtorthaí féideartha smaoineamh ar thorthaí agus ar thurgnaimh cúiseacha. Mar sin féin, tá dhá chastacht breise ann ba cheart duit a choinneáil i gcuimhne. Déantar an dá chastacht seo a chur le chéile go minic faoin dtéarma Tomhaltas Luach Cóireála Aonad Cobhsaí (SUTVA). Is é an chéad chuid de SUTVA an toimhde gurb é an rud is cúis le haghaidh duine \(i\) toradh an raibh an duine sin i riocht cóireála nó rialaithe. I bhfocail eile, glactar leis nach bhfuil tionchar ag an gcóireáil a thugtar do dhaoine eile ar an duine sin \(i\) . Uaireanta tugtar "gan cur isteach" nó "gan spillavers" air seo, agus is féidir é a scríobh mar:

\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]

áit a bhfuil veicteoir stádas cóireála do gach duine seachas \(i\) \(\mathbf{W_{-i}}\) \(i\) . Is féidir bealach amháin gur féidir é seo a shárú más rud é go ndéanann an duine a chóireáil isteach ar dhuine eile, go dearfach nó go diúltach. Ag filleadh ar thurgnamh Restivo agus van de Rijt, samhlaigh beirt chairde \(i\) agus \(j\) agus ní fhaigheann an duine sin \(i\) barnstar agus \(j\) . Má tá \(i\) ag fáil an scéalta cúiseanna \(j\) chun níos mó a chur in eagar (gan tuiscint ar iomaíocht) nó níos lú a chur in eagar (gan mothú éadóchais), tá SUTVA sárú. Is féidir é a shárú freisin má bhíonn tionchar na cóireála ag brath ar líon iomlán daoine eile a fhaigheann an chóireáil. Mar shampla, má thug Restivo agus van de Rijt amach 1,000 nó 10,000 stíl saoire in áit 100, d'fhéadfadh sé seo tionchar a bheith ag an éifeacht a bhaineann le scéala a fháil.

Ba é an dara ceist a cuireadh isteach i SUTVA an toimhde gurb é an t-aon chóireáil ábhartha an ceann a sheachalann an taighdeoir; Uaireanta níl aon chóireálachaeisiamh ar bith i gceist leis an toimhde seo . Mar shampla, i Restivo agus van de Rijt, d'fhéadfadh sé gur tharla gur thug na taighdeoirí ba chúis leis na heagarthóirí a bheith le feiceáil ar leathanach eagarthóirí tóir agus go raibh sé ar an leathanach eagarthóirí tóir-seachas a fháil ar scéala saoire- ba chúis leis an athrú ar iompar eagarthóireachta. Má tá sé seo fíor, níl éifeacht idirbheartaithe an scéalta á léiriú ón éifeacht a bhíonn ar leathanach na n-eagarthóirí tóir. Ar ndóigh, níl sé soiléir más rud é, ó thaobh eolaíoch, gur chóir é seo a mheas tarraingteach nó gan choinne. Is é sin, d'fhéadfá a shamhlú ar thaighdeoir a rá go n-áirítear na héifeachtaí a bhaineann le hearra a fháil ar na cóireálacha go léir ina dhiaidh sin. Nó d'fhéadfá a shamhlú ar chás ina mbeadh taighde ag iarraidh a leithéidiú de shaoróga na n-ábhar eile sin a dhíscaoileadh. Is é bealach amháin chun smaoineamh air ná a iarraidh má tá rud ar bith a fhágann cad atá Gerber and Green (2012) (lch 41) glaoch ar "miondealú i siméadracht"? I bhfocail eile, an bhfuil aon ní seachas an chóireáil a chiallaíonn go gcaithfear déileáil le héagsúlacht le daoine sna coinníollacha cóireála agus rialaithe? Is cúis imní faoi bhriseadh siméadrachta iad na príomh-othair sa ghrúpa rialaithe i dtrialacha míochaine chun pillín phlaicéabó a ghlacadh. Ar an mbealach sin, is féidir le taighdeoirí a bheith cinnte go bhfuil an t-aon difríocht idir an dá choinníoll ná an leigheas iarbhír agus nach bhfuil an taithí ag baint leis an bpill.

Le haghaidh tuilleadh ar SUTVA, féach alt 2.7 de Gerber and Green (2012) , alt 2.5 de Morgan and Winship (2014) , agus alt 1.6 de Imbens and Rubin (2015) .

Beachtas

San alt roimhe seo, chuir mé síos ar an gcaoi meastachán a dhéanamh ar an éifeacht meánchóireála. Sa chuid seo, cuirfidh mé roinnt smaointe ar fáil maidir le héagsúlacht na meastachán sin.

Má cheapann tú faoi mheastachán a dhéanamh ar an meán éifeacht cóireála mar mheasúnú ar an difríocht idir dhá mheán sampla, ansin is féidir a thaispeáint gurb é earráid chaighdeánach an éifeacht chóireála meán ná:

\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]

áit a bhfuil \(m\) daoine a shanntar le cóireáil agus \(Nm\) le rialú (féach Gerber and Green (2012) , sr.4). Dá bhrí sin, nuair atá tú ag smaoineamh ar cé mhéad duine a dhéantar chun cóireáil a shannadh agus cé mhéad a shannadh chun rialú a dhéanamh, is féidir leat a fheiceáil más rud é \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) , ansin is mian leat \(m \approx N / 2\) , chomh fada agus a bhíonn costais na cóireála agus na rialaithe mar an gcéanna. Déanann Cothromóid 4.6 soiléiriú cén fáth go ndearnadh triail ar dhearadh na mBannaí agus na gcomhghleacaithe (2012) maidir le héifeachtaí na faisnéise sóisialta maidir le vótáil (figiúr 4.18) go héifeachtach ó thaobh staitisticí. Cuimhnigh go raibh 98% de na rannpháirtithe sa riocht cóireála. Chiallaigh sé seo nach raibh an iompar meán sa riocht rialaithe measta chomh cruinn agus a d'fhéadfadh a bheith ann, rud a chiallaigh go raibh an difríocht mheasta idir an riocht cóireála agus rialaithe measta chomh cruinn agus is féidir. Le tuilleadh eolais ar leithdháileadh na rannpháirtithe ar choinníollacha, lena n-áirítear nuair a bhíonn costais difriúla idir na coinníollacha, féach an List, Sadoff, and Wagner (2011) .

Mar fhocal scoir, sa phríomhthéacs, chuir mé síos ar an gcaoi ar féidir meastóir difríochtaí i difríochtaí, a úsáidtear de ghnáth i ndearadh mheasctha, athrú níos lú a bheith ann ná meastóir difríochta-i-acmhainn, a úsáidtear de ghnáth in ábhair idir-ábhair dearadh. Más \(X_i\) luach an toraidh sula ndéantar cóireáil air, ansin is é an méid atá muid ag iarraidh meastachán a dhéanamh leis an gcur chuige difríocht i difríochtaí ná:

\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]

Is é earráid chaighdeánach na cainníochta sin (féach Gerber and Green (2012) , m.sh. 4.4)

\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]

Comparáid idir eq. 4.6 agus cearnach. Léiríonn 4.8 go mbeidh earráid chaighdeánach níos lú ag an gcur chuige difríocht-i-difríochtaí nuair (féach Gerber and Green (2012) , m.sh. 4.6)

\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]

Go \(X_i\) , nuair a bhíonn \(X_i\) an- \(Y_i(1)\) ar \(Y_i(1)\) agus \(Y_i(0)\) , ansin is féidir leat meastacháin níos cruinne a fháil ó chur chuige difríocht-difríochtaí ná ó difríocht- de-ciallaíonn ceann amháin. Is é bealach amháin chun smaoineamh ar seo i gcomhthéacs turgnamh Restivo agus van de Rijt ná go bhfuil go leor athruithe nádúrtha sa mhéid a chuireann daoine in eagar, mar sin déanann sé seo comparáid a dhéanamh idir na coinníollacha cóireála agus rialaithe deacair: tá sé deacair coibhneasta a aimsiú éifeacht bheag i sonraí toraidh noisy. Ach má tá tú éagsúil leis an éagsúlacht seo a tharlaíonn go nádúrtha, ansin tá éagsúlacht i bhfad níos lú, agus go ndéanann sé níos éasca éifeacht bheag a bhrath.

Féach Frison and Pocock (1992) chun comparáid bheacht a dhéanamh ar chur chuige difríocht-ar-chiallaíonn, difríocht-difríochtaí, agus cur chuige bunaithe ar ANCOVA sa suíomh níos ginearálta ina bhfuil réamh-chóireáil agus iarchóireáil iolraí éagsúla. Go háirithe, molaíonn siad go láidir ANCOVA, nach bhfuil clúdaithe agam anseo. Ina theannta sin, féach McKenzie (2012) le haghaidh plé ar thábhacht na mbeart toradh iarchóireála iolrach.