2024/07 2

인과추론 방법론들에 대한 생각: 대체 뭐가 인과관계인지

이게 상관관계냐 아니면 인과관계냐 하는 것은 통계학이나 여러 실증적 사회과학에서 자주 제기되는 상투적인 질문이다. 나는 이 질문을 별로 좋아하지 않는데, 말이 너무 추상적이고 모호해서 그렇다. 도대체 상관관계와 인과관계의 차이를 무엇이라고 엄밀하게 정의할 수 있는가? 그리고 그러한 '엄밀한 정의'를 실증 연구에 적용하기 위한 '실행 가능한 정의'는 무엇인가? 다음에 대해서는 어느 정도 합의가 있는 것 같다(내 피셜). 첫째, 상관관계는 인과관계를 포함한다.즉 두 변수가 인과관계를 가지려면 두 변수 간에는 상관관계가 존재해야 한다. 둘째, 인과관계라는 말에는 시간적 순서성이 내포된다.즉 원인의 변화가 먼저 발생해서, 결과의 변화가 나타난다. 이는 다시 말해 상관관계를 구성하는 두 변수 중 무엇이 원인이고 ..

도구변수(IV) 추정법

내생성 문제(Endogeniety; 독립변수와 오차항의 상관이 존재하는 문제)가 존재할 때 사용할 수 있는 한 가지 방법이 도구변수 추정법이다.  내생성 문제가 있는 상황을 고려해보자. 공부시간 $X$에 대하여 성적 $Y$를 회귀시키려고 하는데, 공부시간 $X$는 학생의 지능과 통계적 상관을 가진다. 학생의 지능을 모형의 변수로 추가하는 것이 불가능하다면, 추정된 OLS 회귀계수 $\hat{\beta}$는 공부시간의 순수한 인과영향 $\beta$뿐 아니라 학생의 지능을 경유한 효과까지 포함한다. 즉 공부시간의 순수한 인과영향을 식별할 수 없다. $$Y_{i} = \alpha + \beta X_{i} + e_{i}$$$$E[X_{i}e_{i}] \neq 0$$$$\hat{\beta} \rightarrow_..