시계열&계량경제학

계량경제학 #2 비정규 가정 하에서 OLS 추정량의 성질

seungbeomdo 2023. 5. 14. 23:26

  • CLM 모형의 가정 중 하나는 오차의 조건부 분포가 정규분포라는 것이다.
  • 오차의 조건부 분포에 대한 특별한 가정을 할 수 없는 경우에서 OLS 추정량의 성질을 알아본다.

1. 모형의 가정

  • 기본적으로 CLM의 가정과 동일하지만, 정규성 가정만 제외된다.

1) IID: Independently & Identically Distributed

  • IID 가정은 데이터셋을 구성하는 각 벡터 [$Y_{t}$, $X_{t1}$, $X_{t2}$, ..., $X_{tk}$]가 독립적이고 동일한 확률분포를 갖는다는 것이다.

2) 선형성: Linearity

  • 다음의 식을 성립시키는 $\beta_{*}$가 존재한다.

$$E[Y_{t}|\mathsf{X}_{t}] = \mathsf{X}_{t}^{T}\beta_{*}$$

3) 가역성: Invertibility

  • 다음의 행렬이 가역이다.

$$\mathsf{X}^{T}\mathsf{X}$$

4) 비특이성: 완전한 다중공선성의 부재

  • 독립변수들 간에 선형종속(Linearly dependent) 관계가 존재하지 않는다는 것이다.

5) 외생성: Exogeneity

$$E[\mathsf{X}_{t}U_{t}] = 0$$

6) 등분산성: Homoskedasticity

  • 오차의 조건부 확률분포는 다음과 같다.

$$U_{t}|\mathsf{X}_{t} \sim I.I.D.\,(0, \sigma_{*}^{2})$$
where $$\mathsf{X}_{t} = [X_{t1}, X_{t2}, \cdots , X_{tk}]^{T}$$
 


2. OLS 추정량의 성질

  • 정규성 가정을 하지 않는 경우에도 OLS 추정량은 BLUE가 된다.
  • 단 OLS 추정량은 더이상 정규분포를 따르지 않으며, asymptotically하게만 정규분포를 따른다.
  • asymptotically하게 정규분포를 따른다는 것은, 표본의 크기가 커질수록 점점 더 OLS 추정량의 분포가 정규분포로 근사된다는 것을 의미한다.

 

  • Asymptotic의 세계로 들어오게 되면, 즉 충분히 큰 규모의 샘플을 다루는 논의에서는 OLS 추정량의 consistency 성질이 더 중요해진다.
  • 구체적으로 OLS 추정량이 만족하는 주요한 성질은 다음의 3가지이다.

 

1) Consistency

$$\hat{\beta}_{n} \rightarrow ^{a.s.} \beta _{*}$$
$$\hat{\sigma}^{2}_{n} \rightarrow ^{a.s.} \sigma^{2}_{*}$$

2) Asympototic Normality

$$\sqrt{n}(\hat{\beta}_{n} - \beta_{*}) \sim ^{A} N(0, \sigma^{2}_{*} E[\mathsf{X}_{t} \mathsf{X}_{t}^{T}]^{-1})$$

  • Consistency와 Asymptotic Normality가 성립하기 위해서는, 통계학의 주요한 정리인 대수의 법칙(Law of Large Number)과 중심극한정리(Central Limit Theorem)가 필요하다.

 


3. OLS 추정량을 활용한 가설 검정

  • Asymptotic Normality가 성립하기 때문에, 충분히 큰 규모의 샘플이 주어진 경우에는 여전히 정규분포를 활용한 가설검정이 가능하다.

 

  • 다음의 귀무가설이 참일 때,

$$H_{0}: R\beta_{*}=r$$
 

  • Wald 통계량은 asymptotically하게 카이제곱 분포를 따른다.

 
$$W_{n} = [R\hat{\beta}_{n}-r]^{T}[\hat{\sigma}^{2}_{n}R(\mathsf{X}^{T}\mathsf{X})^{-1}R^{T}]^{-1}[R\hat{\beta}_{n}-r] \sim \chi^{2}{({r})}$$
 

  • 정규분포 가정을 하지 않더라도, 추정량이 aymptotically하게나마 정규분포를 따른다는 것은 가설 검정을 하기 위해 너무나도 중요한 성질이다.
  • 추정량이 어떤 분포를 따르게 되는지 알 수 없다면 가설 검정 자체가 불가능하기 때문이다. 꼭 그 분포가 정규분포일 필요는 없지만, 무슨 분포인지 알기는 해야 한다.
  • 바로 이 점이 중심극한정리의 위대함이다. 모집단에 대한 분포 가정을 하지 않고도, 통계량의 확률분포를 이론적으로 완전하게 구할 수 있다. 그리고 통계량의 확률분포를 사용해서, 불확실한 모수에 대해 확률적으로나마(그리고 그 확률이 얼마인지도 알 수 있다) 추론을 할 수 있다.


4. Asymptotic Property에 대한 실험

 

  • 비정규분포 가정 하에서 asymptotic property가 성립하는지 간단한 실험을 해보자.

 

1) Consistency

 

  • True model이 다음과 같다고 하자.

$$Y_{t} = 3X_{t} + U_{t}$$
where 
$$U_{t} \sim (0, 1^{2})$$
 

  • 샘플 사이즈를 100으로 했을 때, (Y, X)와 오차의 분포는 아래와 같다. 오차의 분포는 전혀 정규분포가 아니다.

 

 

  • 샘플 사이즈를 2부터 1000까지 키우면서 베타와 시그마에 대한 OLS 추정량을 구했다. 샘플 사이즈가 작을 때에는 모수로부터 괴리가 있다가, 점점 더 모수로 가까워짐을 확인할 수 있다.

 

 

2) Asymptotic Normality

 

  • 다음 통계량이 정규분포를 따르는지 확인해보자.

$$\sqrt{n}(\hat{\beta}_{n} - \beta_{*})$$
 

  • 샘플 사이즈가 5일 때, 시뮬레이션된 분포는 정규분포와는 다소 다르게 생겼다.

 

 

  • 샘플 사이즈가 1000일 때, 시뮬레이션된 분포는 정규분포와 훨씬 가까워 보인다.