Notas Matemáticas

Neste apêndice, vou resumir algumas idéias sobre como fazer inferência causal a partir de dados não experimentais em uma forma ligeiramente mais matemática. Existem duas abordagens principais: a estrutura do gráfico causal, a mais associada à Judea Pearl e seus colegas, e a estrutura de resultados potenciais, a maioria associada a Donald Rubin e colegas. Vou apresentar o quadro de resultados potenciais, porque está mais intimamente ligado às idéias nas notas matemáticas no final dos capítulos 3 e 4. Para mais sobre o quadro de gráficos causais, eu recomendo Pearl, Glymour, and Jewell (2016) (introdutório ) e Pearl (2009) (avançado). Para um tratamento extenso de inferência causal que combine o quadro de resultados potenciais e o quadro do gráfico causal, recomendo Morgan and Winship (2014) .

O objetivo deste apêndice é ajudá-lo a se sentir confortável com a notação e o estilo da tradição de resultados potenciais, para que você possa fazer a transição para alguns dos materiais mais técnicos escritos sobre esse tópico. Primeiro, descreverei o quadro de resultados em potencial. Então, vou usá-lo para discutir mais experiências naturais como a de Angrist (1990) sobre o efeito do serviço militar nos lucros. Este apêndice baseia-se fortemente em Imbens and Rubin (2015) .

Quadro de resultados potenciais

O quadro de resultados potenciais tem três elementos principais: unidades , tratamentos e resultados potenciais . Para ilustrar esses elementos, vamos considerar uma versão estilizada da questão abordada em Angrist (1990) : Qual é o efeito do serviço militar nos lucros? Nesse caso, podemos definir as unidades para serem elegíveis para o rascunho de 1970 nos Estados Unidos, e podemos indexar essas pessoas por \(i = 1, \ldots, N\) . Os tratamentos neste caso podem ser "servir nas forças armadas" ou "não servir nas forças armadas". Vou chamá-los de condições de tratamento e controle, e vou escrever \(W_i = 1\) se a pessoa \(i\) está na condição de tratamento e \(W_i = 0\) se a pessoa \(i\) está na condição de controle. Finalmente, os resultados potenciais são um pouco mais conceitualmente difíceis porque envolvem resultados “potenciais”; coisas que poderiam ter acontecido. Para cada pessoa elegível para o draft de 1970, podemos imaginar a quantia que eles teriam ganhado em 1978 se eles servissem nas forças armadas, que eu chamarei de \(Y_i(1)\) , e a quantia que eles teriam ganhado em 1978 se eles não servissem nas forças armadas, que eu chamarei de \(Y_i(0)\) . Na estrutura de resultados potenciais, \(Y_i(1)\) e \(Y_i(0)\) são considerados quantidades fixas, enquanto \(W_i\) é uma variável aleatória.

A escolha de unidades, tratamentos e resultados é crítica porque define o que pode - e não pode - ser aprendido com o estudo. A escolha das unidades - pessoas elegíveis para o projeto de 1970 - não inclui mulheres, e, portanto, sem suposições adicionais, este estudo não nos informará nada sobre o efeito do serviço militar sobre as mulheres. Decisões sobre como definir tratamentos e resultados também são importantes. Por exemplo, deve o tratamento de interesse ser focado em servir nas forças armadas ou em experimentar o combate? O resultado do interesse deve ser lucro ou satisfação no trabalho? Em última análise, a escolha de unidades, tratamentos e resultados deve ser orientada pelos objetivos científicos e políticos do estudo.

Dadas as escolhas de unidades, tratamentos e potenciais resultados, o efeito causal do tratamento na pessoa \(i\) , \(\tau_i\) , é

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]

Em outras palavras, comparamos o quanto a pessoa \(i\) ganharia depois de servir a quantidade de pessoa \(i\) que teria ganho sem servir. Para mim, eq. 2.1 é a maneira mais clara de definir um efeito causal e, embora seja extremamente simples, esse quadro acaba por ser generalizável de muitas formas importantes e interessantes (Imbens and Rubin 2015) .

Ao usar o quadro de resultados potenciais, muitas vezes acho útil escrever uma tabela mostrando os resultados potenciais e os efeitos do tratamento para todas as unidades (tabela 2.5). Se você não conseguir imaginar uma tabela como essa para o seu estudo, talvez seja necessário definir com mais precisão suas definições de unidades, tratamentos e possíveis resultados.

Tabela 2.5: Tabela de Resultados Potenciais
Pessoa Lucro em condição de tratamento Lucro na condição de controle Efeito do tratamento
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
Significar \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

Quando definimos o efeito causal dessa maneira, porém, encontramos um problema. Em quase todos os casos, não conseguimos observar ambos os resultados possíveis. Ou seja, uma pessoa específica serviu ou não serviu. Portanto, observamos um dos resultados potenciais - \(Y_i(1)\) ou \(Y_i(0)\) - mas não ambos. A incapacidade de observar ambos os resultados potenciais é um problema tão importante que Holland (1986) chamou de problema fundamental da inferência causal .

Felizmente, quando estamos fazendo pesquisas, não temos apenas uma pessoa; em vez disso, temos muitas pessoas, e isso oferece uma maneira de contornar o problema fundamental da inferência causal. Em vez de tentar estimar o efeito do tratamento em nível individual, podemos estimar o efeito médio do tratamento para todas as unidades:

\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]

Esta equação ainda é expressa em termos de \(\tau_i\) , que são inobserváveis, mas com alguma álgebra (eq 2.8 de Gerber and Green (2012) ), obtemos

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]

Isso mostra que, se pudermos estimar o resultado médio da população em tratamento ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) e o resultado médio da população sob controle ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), então podemos estimar o efeito médio do tratamento, mesmo sem estimar o efeito do tratamento para qualquer pessoa em particular.

Agora que defini nossa estimativa - a coisa que estamos tentando estimar - veremos como podemos realmente estimar isso com dados. E aqui nos deparamos diretamente com o problema que só observamos um dos possíveis resultados para cada pessoa; nós vemos \(Y_i(0)\) ou \(Y_i(1)\) (tabela 2.6). Poderíamos estimar o efeito médio do tratamento comparando os ganhos das pessoas que serviram aos ganhos das pessoas que não foram atendidas:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]

onde \(N_t\) e \(N_c\) são o número de pessoas nas condições de tratamento e controle. Essa abordagem funcionará bem se a designação do tratamento for independente dos resultados potenciais, uma condição às vezes chamada de ignorabilidade . Infelizmente, na ausência de um experimento, a ignorabilidade não é frequentemente satisfeita, o que significa que o estimador na eq. 2.4 não é provável que produza uma boa estimativa. Uma maneira de pensar sobre isso é que, na ausência de atribuição aleatória de tratamento, eq. 2.4 não está comparando como com gosto; é comparar os ganhos de diferentes tipos de pessoas. Ou expressa de forma ligeiramente diferente, sem atribuição aleatória de tratamento, a alocação de tratamento provavelmente está relacionada aos resultados potenciais.

No capítulo 4, descreverei como experimentos controlados e aleatórios podem ajudar os pesquisadores a fazer estimativas causais, e aqui descreverei como os pesquisadores podem tirar proveito de experimentos naturais, como o sorteio da proposta.

Tabela 2.6: Tabela de Resultados Observados
Pessoa Lucro em condição de tratamento Lucro na condição de controle Efeito do tratamento
1 ? \(Y_1(0)\) ?
2 \(Y_2(1)\) ? ?
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) ? ?
Significar ? ? ?

Experimentos naturais

Uma abordagem para fazer estimativas causais sem executar um experimento é procurar por algo acontecendo no mundo que tenha designado aleatoriamente um tratamento para você. Essa abordagem é chamada de experimentos naturais . Em muitas situações, infelizmente, a natureza não distribui aleatoriamente o tratamento que você deseja para a população de interesse. Mas às vezes, a natureza fornece aleatoriamente um tratamento relacionado. Em particular, considerarei o caso em que há algum tratamento secundário que encoraje as pessoas a receber o tratamento primário . Por exemplo, a minuta poderia ser considerada um tratamento secundário atribuído aleatoriamente que encorajou algumas pessoas a fazer o tratamento primário, que estava servindo nas forças armadas. Este design é chamado às vezes de um design do incentivo . E o método de análise que descreverei para lidar com essa situação às vezes é chamado de variáveis ​​instrumentais . Nesse cenário, com algumas suposições, os pesquisadores podem usar o incentivo para aprender sobre o efeito do tratamento primário para um subconjunto específico de unidades.

Para lidar com os dois tratamentos diferentes - o incentivo e o tratamento primário - precisamos de uma nova notação. Suponha que algumas pessoas sejam desenhadas aleatoriamente ( \(Z_i = 1\) ) ou não rascunhadas ( \(Z_i = 0\) ); nessa situação, \(Z_i\) é às vezes chamado de instrumento .

Entre aqueles que foram redigidos, alguns serviram ( \(Z_i = 1, W_i = 1\) ) e outros não ( \(Z_i = 1, W_i = 0\) ). Da mesma forma, entre os que não foram redigidos, alguns serviram ( \(Z_i = 0, W_i = 1\) ) e outros não ( \(Z_i = 0, W_i = 0\) ). Os possíveis resultados para cada pessoa agora podem ser expandidos para mostrar seu status tanto para o encorajamento quanto para o tratamento. Por exemplo, let \(Y(1, W_i(1))\) ser o salário da pessoa \(i\) se ele foi redigido, onde \(W_i(1)\) é o status do serviço se ele foi redigido. Além disso, podemos dividir a população em quatro grupos: compliers, never-takers, defiers e always-takers (tabela 2.7).

Tabela 2.7: Quatro tipos de pessoas
Tipo Serviço se redigido Serviço se não for elaborado
Compliers Sim, \(W_i(Z_i=1) = 1\) Não, \(W_i(Z_i=0) = 0\)
Nunca tomadores Não, \(W_i(Z_i=1) = 0\) Não, \(W_i(Z_i=0) = 0\)
Defiers Não, \(W_i(Z_i=1) = 0\) Sim, \(W_i(Z_i=0) = 1\)
Sempre compradores Sim, \(W_i(Z_i=1) = 1\) Sim, \(W_i(Z_i=0) = 1\)

Antes de discutirmos a estimativa do efeito do tratamento (isto é, serviço militar), podemos primeiro definir dois efeitos do encorajamento (isto é, ser redigido). Primeiro, podemos definir o efeito do encorajamento no tratamento primário. Em segundo lugar, podemos definir o efeito do encorajamento no resultado. Acontece que esses dois efeitos podem ser combinados para fornecer uma estimativa do efeito do tratamento em um grupo específico de pessoas.

Primeiro, o efeito do encorajamento no tratamento pode ser definido para pessoa \(i\) como

\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]

Além disso, essa quantidade pode ser definida em toda a população como

\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]

Finalmente, podemos estimar \(\text{ITT} _{W}\) usando dados:

\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]

onde \(\bar{W}^{\text{obs}}_1\) é a taxa de tratamento observada para aqueles que foram encorajados e \(\bar{W}^{\text{obs}}_0\) é a taxa observada de tratamento para aqueles que não foram encorajados. \(\text{ITT}_W\) é às vezes chamado de taxa de captação .

Em seguida, o efeito do encorajamento no resultado pode ser definido para a pessoa \(i\) como:

\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]

Além disso, essa quantidade pode ser definida em toda a população como

\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]

Finalmente, podemos estimar \(\text{ITT}_{Y}\) usando dados:

\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]

onde \(\bar{Y}^{\text{obs}}_1\) é o resultado observado (por exemplo, ganhos) para aqueles que foram encorajados (por exemplo, redigidos) e \(\bar{W}^{\text{obs}}_0\) é o resultado observado para aqueles que não foram encorajados.

Finalmente, voltamos nossa atenção para o efeito do interesse: o efeito do tratamento primário (por exemplo, serviço militar) no resultado (por exemplo, ganhos). Infelizmente, não se pode, em geral, estimar esse efeito em todas as unidades. No entanto, com algumas suposições, os pesquisadores podem estimar o efeito do tratamento nos cumpridores (ou seja, pessoas que servirão se elaboradas e pessoas que não servirão se não forem redigidas, tabela 2.7). Vou chamar essa estimativa e o efeito causal médio correspondente (CACE) (que às vezes também é chamado de efeito de tratamento médio local , LATE):

\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]

onde \(G_i\) doa o grupo de pessoas \(i\) (veja a tabela 2.7) e \(N_{\text{co}}\) é o número de compliers. Em outras palavras, eq. 2.11 compara os ganhos dos compliers que são redigidos \(Y_i(1, W_i(1))\) e não redigidos \(Y_i(0, W_i(0))\) . A estimativa na eq. 2,11 parece difícil de estimar a partir de dados observados, porque não é possível identificar compliers usando apenas dados observados (para saber se alguém é mais adequado, você precisaria observar se ele serviu quando elaborado e se ele serviu quando não foi redigido).

Acontece - surpreendentemente - que, se houver algum compliador, desde que se façam três suposições adicionais, é possível estimar o CACE a partir de dados observados. Primeiro, é preciso supor que a designação para tratamento é aleatória. No caso do sorteio, isso é razoável. No entanto, em alguns locais onde experimentos naturais não dependem de randomização física, essa suposição pode ser mais problemática. Em segundo lugar, é preciso supor que não há defesas (essa suposição é às vezes chamada de suposição de monotonicidade). No contexto do esboço, parece razoável supor que há muito poucas pessoas que não servirão se redigidas e servirão se não forem redigidas. Em terceiro lugar, e finalmente, vem a suposição mais importante que é chamada de restrição de exclusão . Sob a restrição de exclusão, deve-se assumir que todo o efeito da atribuição do tratamento é passado através do próprio tratamento. Em outras palavras, é preciso supor que não há efeito direto de encorajamento nos resultados. No caso do projecto de lotaria, por exemplo, é necessário assumir que o estado do projecto não tem efeito sobre os ganhos, excepto através do serviço militar (figura 2.11). A restrição de exclusão poderia ser violada se, por exemplo, as pessoas que foram recrutadas passassem mais tempo na escola para evitar o serviço ou se os empregadores tivessem menor probabilidade de contratar pessoas que foram recrutadas.

Figura 2.11: A restrição de exclusão requer que o incentivo (sorteio de sorteio) tenha um efeito no resultado (ganhos) somente através do tratamento (serviço militar). A restrição de exclusão poderia ser violada se, por exemplo, as pessoas que foram recrutadas passaram mais tempo na escola para evitar o serviço e que esse aumento do tempo na escola levou a ganhos maiores.

Figura 2.11: A restrição de exclusão requer que o incentivo (sorteio de sorteio) tenha um efeito no resultado (ganhos) somente através do tratamento (serviço militar). A restrição de exclusão poderia ser violada se, por exemplo, as pessoas que foram recrutadas passaram mais tempo na escola para evitar o serviço e que esse aumento do tempo na escola levou a ganhos maiores.

Se estas três condições (atribuição aleatória ao tratamento, não defesas e a restrição de exclusão) forem satisfeitas, então

\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]

então podemos estimar o CACE:

\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]

Uma maneira de pensar sobre o CACE é que é a diferença de resultados entre aqueles que foram incentivados e aqueles não incentivados, inflados pela taxa de captação.

Há duas advertências importantes a serem lembradas. Primeiro, a restrição de exclusão é uma forte suposição, e precisa ser justificada caso a caso, o que freqüentemente requer especialização em áreas temáticas. A restrição de exclusão não pode ser justificada com a aleatorização do encorajamento. Segundo, um desafio prático comum com a análise de variáveis ​​instrumentais ocorre quando o encorajamento tem pouco efeito sobre a aceitação do tratamento (quando \(\text{ITT}_W\) é pequeno). Isso é chamado de instrumento fraco e leva a uma variedade de problemas (Imbens and Rosenbaum 2005; Murray 2006) . Uma maneira de pensar sobre o problema com instrumentos fracos é que \(\widehat{\text{CACE}}\) pode ser sensível a pequenos vieses em \(\widehat{\text{ITT}_Y}\) possivelmente devido a violações da restrição de exclusão - porque esses vieses são ampliados por um pequeno \(\widehat{\text{ITT}_W}\) (ver eq. 2.13). Grosso modo, se o tratamento que a natureza atribui não tiver um grande impacto no tratamento de que você gosta, você terá dificuldade em aprender sobre o tratamento de seu interesse.

Veja os capítulos 23 e 24 de Imbens and Rubin (2015) para uma versão mais formal desta discussão. A abordagem econométrica tradicional das variáveis ​​instrumentais é tipicamente expressa em termos de estimativas de equações, não de resultados potenciais. Para uma introdução a partir dessa outra perspectiva, veja Angrist and Pischke (2009) , e para uma comparação entre as duas abordagens, veja a seção 24.6 de Imbens and Rubin (2015) . Uma apresentação alternativa, ligeiramente menos formal, da abordagem de variáveis ​​instrumentais é fornecida no capítulo 6 de Gerber and Green (2012) . Para mais informações sobre a restrição à exclusão, ver D. Jones (2015) . Aronow and Carnegie (2013) descrevem um conjunto adicional de suposições que podem ser usadas para estimar a ATE em vez da CACE. Para saber mais sobre como os experimentos naturais podem ser muito complicados de interpretar, veja Sekhon and Titiunik (2012) . Para uma introdução mais geral aos experimentos naturais - um que vai além da abordagem de variáveis ​​instrumentais para também incluir projetos como a descontinuidade de regressão - ver Dunning (2012) .