గణిత గమనికలు

నేను ప్రయోగాలు అర్ధం చేసుకోవడానికి ఉత్తమ మార్గం సంభావ్య ఫలితం ఫ్రేమ్ (నేను అధ్యాయం 2 లో గణిత శాస్త్ర నోట్లలో చర్చించిన). సంభావ్య ఫలితాల ఫ్రేమ్వర్క్ డిజైన్-ఆధారిత మాదిరి నుండి (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) సన్నిహిత సంబంధాలను కలిగి ఉంది నేను అధ్యాయంలో వివరించిన 3 (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) . ఆ అనుబంధం నొక్కి చెప్పే విధంగా ఈ అనుబంధం వ్రాయబడింది. ఈ ప్రాముఖ్యత ఒక సాంప్రదాయికమైనది కాని, సాంప్రదాయం మరియు ప్రయోగాలు మధ్య అనుసంధానం ఉపయోగకరంగా ఉంటుందని నేను భావిస్తున్నాను: ఇది మాదిరి గురించి మీకు తెలిస్తే, ప్రయోగాలు మరియు వైస్ వెర్సా గురించి మీకు తెలుస్తుంది. నేను ఈ నోట్లలో చూపించాను, సంభావ్య ఫలితాల ఫ్రేమ్, యాదృచ్చిక ప్రభావాలను అంచనా వేయడానికి యాదృచ్ఛిక నియంత్రిత ప్రయోగాలు యొక్క బలం వెల్లడిస్తుంది మరియు ఇది సంపూర్ణ అమలు చేయబడిన ప్రయోగాలు చేయగల పరిమితులను చూపుతుంది.

ఈ అనుబంధంలో, సంభావ్య ఫలితాల ఫ్రేమ్వర్గాన్ని నేను వివరించాను, ఈ అధ్యాయంలో 2 వ అధ్యాయంలోని గణిత శాస్త్ర గమనికల నుండి కొన్ని విషయాలు నకిలీ చేయబడ్డాయి, ఈ నోట్లను మరింత స్వీయ-కలిగి ఉండటానికి. అప్పుడు నేను సగటు చికిత్స ప్రభావాల అంచనాల ఖచ్చితత్వము గురించి కొన్ని ఉపయోగకరమైన ఫలితాలను వివరిస్తాను, వాటిలో సరైన కేటాయింపు మరియు వ్యత్యాసాల వ్యత్యాసాల అంచనాలతో సహా. ఈ అనుబంధం Gerber and Green (2012) పై ఎక్కువగా ఆధారపడుతుంది.

సంభావ్య ఫలితం ఫ్రేమ్

సంభావ్య ఫలితాల ప్రణాళికను వివరించడానికి, రిషివో మరియు వాన్ డి రిజిట్ యొక్క ప్రయోగం వికీపీడియాకు భవిష్యత్ రచనల్లో ఒక బార్న్స్టార్ను తీసుకునే ప్రభావాన్ని అంచనా వేయడానికి తిరిగి వెళ్దాము. సంభావ్య ఫలితాల ప్రణాళికలో మూడు ప్రధాన అంశాలు ఉన్నాయి: యూనిట్లు , చికిత్సలు , మరియు సంభావ్య ఫలితాలను . Restivo మరియు వాన్ డి రిజ్ట్ విషయంలో, యూనిట్లు సంపాదకులకు అర్హులు-టాప్ 1 లో కంట్రిబ్యూటర్లకు-వారు ఇంకా బార్న్స్టార్ను అందుకోలేదు. మనము ఈ సంపాదకులను ఇండెక్స్ \(i = 1 \ldots N\) . వారి ప్రయోగం లో చికిత్సలు ", ఏ barnstar" "barnstar" లేదా ఉన్నాయి మరియు నేను వ్రాయడానికి ఉంటాం \(W_i = 1\) ఉంటే వ్యక్తి \(i\) చికిత్స పరిస్థితి \(W_i = 0\) లేకపోతే. సంభావ్య ఫలితాల యొక్క ముసాయిదాలోని మూడో మూలకం అతి ముఖ్యమైనది: సంభావ్య ఫలితాల . ఇవి "సంభావ్య" ఫలితాలను కలిగి ఉండే విషయాలను కలిగి ఉండటం వలన సంక్లిష్టంగా కష్టంగా ఉంటాయి. ప్రతి వికీపీడియా సంపాదకుడికి, ఆమె చికిత్స స్థితిలో ( \(Y_i(1)\) ) మరియు ఆమె నియంత్రణ స్థితిలో ( \(Y_i(0)\) ).

యూనిట్ల ఈ ఎంపిక, చికిత్సలు మరియు ఫలితాల ఎంపిక ఈ ప్రయోగం నుండి నేర్చుకోగలదని వివరిస్తుంది. ఉదాహరణకు, ఏదైనా అదనపు అంచనాలు లేకుండా, Restivo మరియు వాన్ డి రిజ్ట్ అన్ని వికీపీడియా సంపాదకులు లేదా సంకలన నాణ్యత వంటి ఫలితాలపై బాన్స్టార్స్ ప్రభావం గురించి ఏమీ చెప్పలేరు. సాధారణంగా, యూనిట్లు ఎంపిక, చికిత్సలు, మరియు ఫలితాలు అధ్యయనం యొక్క లక్ష్యాలను ఆధారంగా ఉండాలి.

ఈ సంభావ్య ఫలితాలను ఇచ్చిన-పట్టిక 4.5-లో సంగ్రహించబడుతుంది, ఇది వ్యక్తి యొక్క చికిత్స యొక్క అసాధారణ ప్రభావాన్ని నిర్వచించవచ్చు \(i\)

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]

నాకు, ఈ సమీకరణం ఒక సాధారణ ప్రభావాన్ని నిర్వచించడానికి స్పష్టమైన మార్గం, మరియు చాలా (Imbens and Rubin 2015) , ఈ ఫ్రేమ్ అనేక ముఖ్యమైన మరియు ఆసక్తికరమైన మార్గాల్లో (Imbens and Rubin 2015) సాధారణీకరణకు మారుతుంది.

పట్టిక 4.5: సంభావ్య ఫలితాల పట్టిక
వ్యక్తి చికిత్స స్థితిలో సవరణలు నియంత్రణ స్థితిలో సవరణలు చికిత్స ప్రభావం
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
N \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
అర్థం \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

ఈ విధంగా మేము కారణాన్ని నిర్వచించినట్లయితే, మేము సమస్యను ఎదుర్కొంటాము. దాదాపు అన్ని సందర్భాల్లో, సంభావ్య ఫలితాలను మేము గమనించలేము. అంటే, ఒక వికీపీడియా సంపాదకుడు ఒక బార్న్స్టార్ లేదా అందుకోలేదు. అందువలన, సంభావ్య ఫలితాల్లో \(Y_i(1)\) లేదా \(Y_i(0)\) మేము \(Y_i(0)\) . సంభావ్య ఫలితాలను గమనించడానికి అసమర్థత అనేది Holland (1986) ఇది ప్రాధమిక సమస్య కాసాల్ ఇన్ఫెరెన్స్ అని పిలిచే ప్రధాన సమస్య.

అదృష్టవశాత్తూ, మేము పరిశోధన చేస్తున్నప్పుడు, మనకు కేవలం ఒక వ్యక్తి లేదు, మనకు చాలామంది వ్యక్తులు ఉన్నారు, మరియు ఇది కాసాల్ ఇన్ఫరెన్స్ యొక్క ప్రాధమిక సమస్య చుట్టూ ఒక మార్గం అందిస్తుంది. వ్యక్తిగత-స్థాయి చికిత్స ప్రభావాన్ని అంచనా వేయడానికి ప్రయత్నించినా, మనం సగటు చికిత్స ప్రభావాన్ని అంచనా వేయవచ్చు:

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]

ఇది ఇప్పటికీ గమనింపబడని \(\tau_i\) పరంగా వ్యక్తీకరించబడింది, కానీ కొన్ని ఆల్జీబ్రాతో ( Gerber and Green (2012) యొక్క EQ 2.8) మనకు లభిస్తుంది

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]

సమతుల్యత 4.3 చికిత్సలో జనాభా సగటు ఫలితాన్ని అంచనా \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) మరియు జనాభా సగటు ఫలిత నియంత్రణ ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), అప్పుడు మేము ఏ వ్యక్తికి చికిత్స ప్రభావాన్ని అంచనా వేయకుండా కూడా సగటు చికిత్స ప్రభావాన్ని అంచనా వేయవచ్చు.

ఇప్పుడు నేను మా అంచనాలను నిర్వచించాను-మేము అంచనా వేయడానికి ప్రయత్నిస్తున్న విషయం-నేను వాస్తవానికి డేటాతో మనం ఎలా అంచనా వేస్తాం. నేను ఈ అంచనా సవాలు గురించి సాంప్లింగ్ సమస్యగా ఆలోచించాలనుకుంటున్నాను (అధ్యాయం 3 లోని గణితసంబంధమైన గమనికలను తిరిగి ఆలోచించండి). మేము చికిత్స స్థితిలో పరిశీలించడానికి కొంతమంది వ్యక్తులు యాదృచ్ఛికంగా ఎంచుకున్నారని ఊహించు మరియు నియంత్రణ పరిస్థితిలో పరిశీలించడానికి కొంత మంది వ్యక్తులు యాదృచ్ఛికంగా ఎంచుకున్నాము, అప్పుడు ప్రతి పరిస్థితిలో సగటు ఫలితాన్ని అంచనా వేయవచ్చు:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]

ఇక్కడ \(N_t\) మరియు \(N_c\) చికిత్స మరియు నియంత్రణ పరిస్థితులలో వ్యక్తుల సంఖ్య. సమీకరణం 4.4 వ్యత్యాసం-యొక్క-అర్థరహిత అంచనాదారు. నమూనా రూపకల్పన కారణంగా, మొదటి నిబంధన చికిత్సలో సగటు ఫలితం కోసం నిష్పాక్షికమైన అంచనాదారుగా మరియు రెండోసారి నియంత్రణలో ఉన్న ఒక నిష్పాక్షికమైన అంచనాదారు అని మనకు తెలుసు.

రాండమైజేషన్ ఎనేబుల్ చెయ్యటం గురించి ఆలోచించడానికి మరో మార్గం ఏమిటంటే ఇది చికిత్స మరియు నియంత్రణ సమూహాల మధ్య పోలిక సరసమైనదని నిర్ధారిస్తుంది, ఎందుకంటే యాదృచ్ఛికీకరణ అనేది రెండు బృందాలు ఒకదానితో మరొకటి పోలివుంటాయని నిర్ధారిస్తుంది. ఈ పోలిక మేము లెక్కించిన విషయాలు (ప్రయోగానికి ముందు 30 రోజుల్లో సవరణల సంఖ్యను చెప్పండి) మరియు మేము లెక్కించని విషయాలు (లింగంగా చెప్పడం) కలిగి ఉన్నాయని అర్థం. గమనించిన మరియు గమనింపబడని కారకాలపై సమతుల్యతను నిర్ధారించే ఈ సామర్ధ్యం చాలా క్లిష్టమైనది. గమనింపబడని అంశాలపై ఆటోమేటిక్ బాలెన్సింగ్ యొక్క శక్తిని చూడడానికి, భవిష్యత్తులో పరిశోధన పురుషులు మహిళల కంటే అవార్డులకు మరింత ప్రతిస్పందిస్తుందని తెలుసుకుందాం. అది Restivo మరియు వాన్ డి రిజ్ట్ యొక్క ప్రయోగం ఫలితాలను చెల్లుబాటు కాదా? యాదృచ్చికం ద్వారా నం. వారు నిరాశాజనకంగా ఉంటారని నిశ్చయించుకున్నారు. తెలియని వ్యతిరేకంగా ఈ రక్షణ చాలా శక్తివంతమైనది, మరియు అది ప్రయోగాలు అధ్యాయం 2 లో వివరించిన నాన్-ప్రయోగాత్మక పద్ధతుల నుండి భిన్నమైనవి.

మొత్తం జనాభాకు చికిత్స ప్రభావాన్ని నిర్వచించడానికి అదనంగా, ప్రజల ఉపసమితికి చికిత్స ప్రభావాన్ని నిర్వచించడం సాధ్యపడుతుంది. ఇది సాధారణంగా నియత సగటు చికిత్స ప్రభావాన్ని (CATE) పిలుస్తారు. ఉదాహరణకి, Restivo మరియు వాన్ డి రిజ్ట్ చేసిన అధ్యయనంలో, ప్రయోగం ముందు 90 రోజులలో సంపాదకుల మధ్యస్థ సంఖ్యలో లేదా అంతకంటే తక్కువ సంపాదకుడిగా ఉన్నదా అని \(X_i\) ఊహించుకోండి. ఈ కాంతి మరియు భారీ సంపాదకులకు విడిగా చికిత్స ప్రభావాన్ని లెక్కించవచ్చు.

సంభావ్య ఫలితాల ఫ్రేమ్ అనేది కామన్ రిఫరెన్స్ మరియు ప్రయోగాలు గురించి ఆలోచించడానికి ఒక శక్తివంతమైన మార్గం. ఏమైనప్పటికీ, రెండు అదనపు సంక్లిష్టతలను మీరు గుర్తుపెట్టుకోవాలి. ఈ రెండు సంక్లిష్టతలను తరచూ స్టేబుల్ యూనిట్ ట్రీట్మెంట్ వాల్యూ అజంప్షన్ (SUTVA) అనే పదంతో కూడుకొని ఉంటాయి. SUTVA యొక్క మొదటి భాగం వ్యక్తి \(i\) యొక్క ఫలితం మాత్రమే విషయం ఆ వ్యక్తి చికిత్స లేదా నియంత్రణ స్థితిలో ఉందో లేదో అనే భావన ఉంది. వేరొక మాటలో చెప్పాలంటే, ఇతరులకు ఇచ్చిన చికిత్స ద్వారా వ్యక్తి \(i\) ప్రభావితం కాదని భావించబడుతుంది. ఇది కొన్నిసార్లు "ఎటువంటి జోక్యం" లేదా "ఏ స్పిల్ఓవర్స్" గా పిలువబడుతుంది మరియు దీనిని ఇలా రాస్తారు:

\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]

ఇక్కడ \(\mathbf{W_{-i}}\) అనేది వ్యక్తి \(i\) కాకుండా ప్రతిఒక్కరికీ చికిత్స స్థలాల యొక్క వెక్టర్. ఒక వ్యక్తి నుండి చికిత్స మరొక వ్యక్తికి పైకి చొచ్చుకు పోయినట్లయితే, అది సానుకూలంగా లేదా ప్రతికూలంగా ఉండినట్లయితే ఇది ఒక ఉల్లంఘన. రిషివియో మరియు వాన్ డి రిజిట్ యొక్క ప్రయోగానికి తిరిగి రావడం ఇద్దరు స్నేహితులు \(i\) మరియు \(j\) మరియు ఆ వ్యక్తి \(i\) ఒక బార్న్స్టార్ మరియు \(j\) లేదు అని ఊహించుకోండి. అయితే \(i\) barnstar స్వీకరించడం కారణమవుతుంది \(j\) మరింత సవరించడానికి (పోటీ స్ఫూర్తిని బయటకు) లేదా తక్కువ (నిరాశ యొక్క భావాన్ని బయటకు) సవరించి, ఆపై SUTVA ఉల్లంఘించడంపై. చికిత్స యొక్క ప్రభావము చికిత్స పొందిన ఇతర ప్రజల సంఖ్య మీద ఆధారపడి ఉంటే అది కూడా ఉల్లంఘించవచ్చు. ఉదాహరణకి, Restivo మరియు వాన్ డి రిజ్ట్ 100 లేదా బదులుగా 10,000 బారెస్ట్ స్టార్స్ ఇచ్చినట్లయితే, ఇది ఒక బార్న్స్టార్ను స్వీకరించే ప్రభావాన్ని ప్రభావితం చేసి ఉండవచ్చు.

SUTVA గా పిలవబడే రెండో సమస్య, పరిశోధకుడు కేవలం ఇచ్చే చికిత్సకు మాత్రమే సంబంధించిన భావన; ఈ భావనను కొన్నిసార్లు దాచిన చికిత్సలు లేదా మినహాయింపు అని పిలుస్తారు. ఉదాహరణకి, Restivo మరియు వాన్ డి రిజ్ట్ లో, ఇది ఒక barnstar ఇవ్వడం ద్వారా పరిశోధకులు ఒక ప్రముఖ సంపాదకులు పేజీలో వ్యాఖ్యానించడానికి మరియు ప్రముఖ సంపాదకులు పేజీలో ఉండటం వలన ఒక బార్న్స్టార్- ఇది ఎడిటింగ్ ప్రవర్తనలో మార్పుకు కారణమైంది. ఇది నిజమైతే, బార్న్స్టార్ యొక్క ప్రభావము ప్రముఖ సంపాదకుల పుటలో ఉండే ప్రభావము నుండి వేరుగా ఉండదు. శాస్త్రీయ దృక్పథం నుండి, ఇది ఆకర్షణీయమైన లేదా ఆకర్షణీయం కానిదిగా పరిగణించబడాలంటే, స్పష్టంగా లేదు. అనగా, ఒక పరిశోధకుడు ఒక బార్న్స్టార్ స్వీకరించే ప్రభావము బార్న్స్టార్ ట్రిగ్గర్స్ అన్ని తదుపరి చికిత్సలను కలిగి ఉంటాడని మీరు ఊహిస్తారు. లేదా ఈ ఇతర విషయాల ను 0 డి బార్న్స్టార్స్ ప్రభావాన్ని వేరుచేసే 0 దుకు ఒక పరిశోధన చేయాలనుకునే పరిస్థితిని మీరు ఊహి 0 చుకోవచ్చు. Gerber and Green (2012) (పేజి 41) లకు దారితీసే ఏదైనా ఉన్నట్లయితే దాని గురించి ఆలోచించడానికి ఒక మార్గం ఏమిటంటే "సమరూపంలో విచ్ఛిన్నం" అని పిలవబడుతుందా? మరో మాటలో చెప్పాలంటే, చికిత్స మరియు నియంత్రణ పరిస్థితులలో ప్రజలను భిన్నంగా చికిత్స చేయటానికి చికిత్స చేసే మరేదైనా ఉందా? సమస్యాత్మక బ్రేకింగ్ గురించిన ఆందోళనలు వైద్య పరీక్షలలో నియంత్రిత సమూహంలో ప్రధాన రోగుల్లో ఒక ప్లేస్బో మాత్రను తీసుకుంటాయి. ఈ విధంగా, పరిశోధకులు రెండు పరిస్థితుల మధ్య తేడా మాత్రమే వాస్తవ ఔషధం అని మరియు మాత్రను తీసుకునే అనుభవం కాదు.

SUTVA పై మరిన్ని వివరాలకు, Gerber and Green (2012) యొక్క విభాగం 2.7, Morgan and Winship (2014) యొక్క విభాగం 2.5 మరియు Imbens and Rubin (2015) యొక్క విభాగం 1.6 చూడండి.

ప్రెసిషన్

మునుపటి విభాగంలో, నేను సగటు చికిత్స ప్రభావాన్ని అంచనా వేయడం గురించి వివరించాను. ఈ విభాగంలో, నేను ఆ అంచనాల వైవిధ్యత గురించి కొన్ని ఆలోచనలను అందిస్తాను.

మీరు రెండు నమూనా మార్గాల మధ్య వ్యత్యాసాన్ని అంచనా వేయడానికి సగటు చికిత్స ప్రభావాన్ని అంచనా వేస్తే, సగటు చికిత్స ప్రభావం యొక్క ప్రామాణిక లోపం ఏమిటంటే:

\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]

ఇక్కడ \(m\) ప్రజలు చికిత్సకు కేటాయించిన మరియు నియంత్రించడానికి \(Nm\) ( Gerber and Green (2012) , eq 3.4 చూడండి). కాబట్టి, చికిత్సకు ఎన్ని కేటాయించాలో మరియు ఎంత మంది నియంత్రించడానికి నియమిస్తారు అనేదాని గురించి ఆలోచిస్తూ, మీరు \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) , అప్పుడు చికిత్స మరియు నియంత్రణ ఖర్చులు ఒకే విధంగా ఉన్నంత వరకు మీరు \(m \approx N / 2\) . ఓటింగ్పై సాంఘిక సమాచారం యొక్క ప్రభావాల గురించి బాండ్ మరియు సహచరులు ' (2012) ప్రయోగం ఎందుకు (సమరూపత 4.6) యొక్క సమీకరణం గణాంకపరంగా అసమర్థమైనది. చికిత్స స్థితిలో 98% మంది పాల్గొన్నట్లు గుర్తుంచుకోండి. దీని అర్థం, నియంత్రణ స్థితిలో ఉన్న సగటు ప్రవర్తన ఖచ్చితంగా ఉన్నట్లుగా అంచనా వేయబడలేదు, దీని వలన చికిత్స మరియు నియంత్రణ పరిస్థితి మధ్య వ్యత్యాసం ఖచ్చితంగా అంచనా వేయబడలేదని అంచనా వేశారు. షరతుల మధ్య వ్యయాలు భిన్నంగా ఉన్నప్పుడు పరిస్థితులకు, పాల్గొనే వారి యొక్క సరైన కేటాయింపుపై, List, Sadoff, and Wagner (2011) .

అంతిమంగా, ముఖ్య పాఠ్యంలో, మిశ్రమ రూపకల్పనలో ఉపయోగించే వ్యత్యాసాల వ్యత్యాసాలకు, వ్యత్యాసాల అంచనాదారుని కంటే తక్కువ వ్యత్యాసాలకు దారితీస్తుంది, ఇది మధ్య-విషయాలలో సాధారణంగా ఉపయోగించబడుతుంది రూపకల్పన. చికిత్సకు ముందు ఫలితం యొక్క విలువ \(X_i\) , వ్యత్యాసం-వైవిధ్య విధానాలతో మనం అంచనా వేయడానికి ప్రయత్నిస్తున్న పరిమాణం:

\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]

ఆ పరిమాణం యొక్క ప్రామాణిక దోషం ( Gerber and Green (2012) , eq 4.4 చూడండి)

\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]

Eq యొక్క పోలిక. 4.6 మరియు eq. 4.8 వ్యత్యాసం-వైవిధ్య విధానంలో చిన్న ప్రామాణిక లోపాన్ని కలిగి ఉన్నప్పుడు ( Gerber and Green (2012) , eq 4.6 చూడండి)

\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]

సుమారు, ఉన్నప్పుడు \(X_i\) చాలా సూచన \(Y_i(1)\) మరియు \(Y_i(0)\) , అప్పుడు మీరు మరింత ఖచ్చితమైన అంచనాలు difference- నుంచి కంటే తేడాలు-యొక్క-తేడాలు విధానం నుండి పొందవచ్చు ఒకటి అర్థం. Restivo మరియు వాన్ డి రిజ్ట్ యొక్క ప్రయోగం సందర్భంలో దీనిని గురించి ఆలోచించటానికి ఒక మార్గం ఏమిటంటే, ప్రజలు సవరించిన మొత్తంలో సహజ వైవిధ్యాలు చాలా ఉన్నాయి, అందువల్ల ఇది చికిత్స మరియు నియంత్రణ పరిస్థితులను కష్టతరం చేస్తుంది: ఇది సాపేక్షతను గుర్తించడం కష్టం ధ్వని ఫలితం డేటాలో చిన్న ప్రభావం. కానీ మీరు ఈ సహజంగా సంభవించే వైవిధ్యతను విడదీస్తే, అప్పుడు చాలా తక్కువ వైవిధ్యం ఉంటుంది మరియు ఇది ఒక చిన్న ప్రభావాన్ని సులభంగా గుర్తించగలదు.

అనేక కొలతలు ముందు చికిత్స మరియు పోస్ట్-చికిత్స ఉన్న సాధారణ సాధారణ అమరికలో తేడా-యొక్క-తేడాలు, వ్యత్యాసం-తేడాలు మరియు ANCOVA- ఆధారిత విధానాల యొక్క ఖచ్చితమైన పోలిక కోసం Frison and Pocock (1992) చూడండి. ప్రత్యేకించి, వారు ANCOVA ను గట్టిగా సిఫార్సు చేస్తారు, నేను ఇక్కడ కవర్ చేయలేదు. అంతేకాక, McKenzie (2012) బహుళ చికిత్స-చికిత్స ఫలితం యొక్క ప్రాముఖ్యత గురించి చర్చకు చూడండి.