시계열&계량경제학

시계열 분석 #11: VAR 모형의 이슈들

seungbeomdo 2023. 2. 15. 16:58

전 포스팅에서 VAR의 기본 골격을 살펴보았다. 여기서는 VAR 모형을 풍부하게 만들어주는 추가적인 이슈들을 고려한다.

1. 구조적 벡터자기회귀모형(SVAR; Structural VAR)

  • 이전 포스팅에서 다룬 VAR은 Reduced Form VAR이라고 한다. 축소모형이라고도 부른다. 계량경제학 모형에서 Structural과 Reduced의 구분은 그 모형이 경제학 이론을 반영한 계량 모형인지 혹은 단지 복수의 변수 간의 관찰된 통계적 상관성만을 기술하는 모형인지에 따른 것이다. 전자이면 Structural, 후자이면 Reduced이다.

 

  • 가령 인플레이션율과 GDP 증가율을 VAR 모형으로 추정한다고 하자. reduced from VAR는 다음과 같이 경제이론에 대한 고려 없이 단순하게 두 변수로 구성된 시계열을 AR process로 표현한 것일 뿐이다.

 

$$\begin{bmatrix} P_{t} \\ Y_{t} \end{bmatrix} = \begin{bmatrix} \phi_{11} \phi_{12} \\ \phi_{21} \phi_{22} \end{bmatrix} \begin{bmatrix} P_{t-1} \\ Y_{t-1} \end{bmatrix} + \begin{bmatrix} \epsilon_{1t} \\ \epsilon_{2t} \end{bmatrix}$$

  • 연립방정식으로 풀어쓰면 아래와 같다.

 

$P_{t} = \phi_{11}P_{t-1} + \phi_{12}Y_{t-1} + \epsilon_{1t}$
$Y_{t} = \phi_{21}P_{t-1} + \phi_{22}Y_{t-1} + \epsilon_{2t}$

  • 여기서 얻어지는 모수들은 순수하게 통계적으로만 결정된다. 모수값이 엉뚱하게 나오더라도 경제학적으로 설명할 길이 없다. "그냥 관찰된 데이터로부터 이렇게 정해졌다"라는 것이기 때문이다.

 

  • 그런데 고전파 경제학 모형에서는 GDP 증가율이 물가 상승률의 함수라는 아이디어를 거부한다. 경제를 장기적인 관점에서 바라보기 때문이다. 수요가 증가해서 물가가 높아지면 기업들의 생산이 늘어난다. 하지만 잠재수준을 초과하는 생산으로 인해 임금이 높아지고 다시 기업들의 생산이 줄어들어 잠재 수준으로 생산이 돌아온다. 따라서 GDP 증가율은 그 국가의 부존요소나 기술수준 등의 함수일 뿐이지 물가 상승률의 함수는 아니라는 것이다.

 

  • 경제 이론이 주 관심은 아니니까. 아무튼 이런 아이디어를 반영하면 VAR 모형을 다음과 같이 짤 수 있다.

 

$$\begin{bmatrix} 1 \,\; \alpha \\ 0 \,\; 1 \end{bmatrix} \begin{bmatrix} P_{t} \\ Y_{t} \end{bmatrix} = \begin{bmatrix} \phi_{11} \phi_{12} \\ 0 \;\,\, \phi_{22} \end{bmatrix} \begin{bmatrix} P_{t-1} \\ Y_{t-1} \end{bmatrix} + \begin{bmatrix} \epsilon_{1t} \\ \epsilon_{2t} \end{bmatrix}$$

 

  • 연립방정식으로 풀어쓰면 아래와 같다. 고전파 모형이 가정하는 것처럼, GDP 성장률은 인플레이션율과 무관하게 결정되도록 회귀식의 구조를 제한한 것이다.

 

$P_{t} = \phi_{11}P_{t-1} + \phi_{12}Y_{t-1} - \alpha Y_{t} + \epsilon_{1t}$
$Y_{t} = \phi_{22}Y_{t-1} + \epsilon_{2t}$


2. 그래인저 인과관계(Granger Causality)

  • 그래인저 인과관계란 VAR 모형에서 벡터를 구성하는 복수의 시계열이 서로 영향을 주는지를 측정하는 개념이다. 시계열 $\{X_{t}\}$가 시계열 $\{Y_{t}\}$의 미래값을 예측하는 데 도움이 될 때, $\{X_{t}\}$는 $\{Y_{t}\}$에 대하여 그래인저 인과(Granger-cause)를 갖는다고 말한다.

 

  • 그래인저 인과관계를 검정하는 것은 다음의 방법에 의한다. 적당한 시차 p로부터 GDP 증가율과 물가상승률 간의 VAR 모형을 정의했다고 하자. 이때 t 시점의 GDP 증가율은 다음과 같다.

 

$$Y_{t} = \alpha_{1}P_{t-1} + \alpha_{2}P_{t-2} + ... + \alpha_{p}P_{t-p} + \beta_{1}Y_{t-1} + \beta_{1}Y_{t-2} + ... + \beta_{p}Y_{t-p} + \epsilon_{2t}$$

  • 물가상승률이 GDP 증가율에 그래인저 인과를 갖는지 검정하는 것은, 물가상승률의 시차 변수들의 회귀계수들이 모두 0이라는 귀무가설을 검정하는 것이다. 이때 GDP 증가율의 시차 변수들의 회귀계수들은 고려하지 않는다.

 

$$\alpha_{1} =\alpha_{2} = ... =\alpha_{p} = 0$$

  • 직전 포스팅에서 다루었던 콜금리 상승률과 CPI 상승률 간의 관계에 그래인저 인과가 성립하는지 알아보자.
forecast_model_fit.test_causality('Call', 'CPI', kind='f').summary()
forecast_model_fit.test_causality('CPI', 'Call', kind='f').summary()

 

  • 콜금리 상승률과 CPI 상승률은 둘다 서로에 대해 그레인저 인과를 갖는다는 결론이다.

3. 충격반응 함수(IRF; Impulse Response Function)

3.1. 충격반응 함수의 직관적 개요

  • VAR 모형에서는 특정 시점 t에서 특정 시계열에 충격이 발생했을 때, 다른 시계열에 어떤 영향을 주는지 분석하는 것이 가능하다. 즉 다음과 같은 VAR(2) 모형에서

 

$P_{t} = \phi_{11}P_{t-1} + \phi_{12}Y_{t-1} + \epsilon_{1t}$
$Y_{t} = \phi_{21}P_{t-1} + \phi_{22}Y_{t-1} + \epsilon_{2t}$

  • 인플레이션율에 시점 1에서 발생한 충격은 오차항 $\epsilon_{1,1}$이다. GDP 증가율에는 다른 충격이 발생하지 않으며, 인플레이션율에도 이후 시점에서는 충격이 발생하지 않는다고 가정하자. 그러면 시점 1에 인플레이션율에 발생한 오차항이 향후 GDP 증가율 $Y_{j} \;(j>0)$에 미치는 영향력은 다음과 같이 계산한다.

 

  • 먼저, 시계열의 초기값은 $Y_{0} = 0, \; P_{0} = 0$이라고 가정하자. 이는 시계열이 절편을 가지고 있지 않다는 가정인데, 어차피 충격 자체를 분석할 때는 절편이 있건 없건 상관이 없기 때문에 임시적으로 사용하는 합리적인 가정이다. 이때 이후 시점 1, 2, ... 에서 시계열의 값을 예시하면

 

$P_{1} = \phi_{11}P_{0} + \phi_{12}Y_{0} + \epsilon_{1,0} = \epsilon_{1,1}$
$Y_{1} = \phi_{21}P_{0} + \phi_{22}Y_{0} + \epsilon_{2,1}= 0$

$P_{2} =\phi_{11}P_{1} + \phi_{12}Y_{1} + \epsilon_{1,2} = \phi_{11}\epsilon_{1,0}$
$Y_{2} =\phi_{21}P_{1} + \phi_{22}Y_{1} + \epsilon_{2,2}= \phi_{21}\epsilon_{1,0}$

$P_{3} =\phi_{11}P_{2} + \phi_{12}Y_{2} + \epsilon_{1,3} =\phi_{11}^{2} \epsilon_{1,0} + \phi_{12}\phi_{21}\epsilon_{1,0}$
$Y_{3} =\phi_{21}P_{2} + \phi_{22}Y_{2} + \epsilon_{2,3} = \phi_{21}\phi_{11}\epsilon_{1,0} + \phi_{22}\phi_{21}\epsilon_{1,0}$

$\vdots$

  • 그러므로 1 시점에 인플레이션율에 충격이 발생했을 때 GDP 증가율에 미치는 영향은 위의 값들을 1 시점 인플레이션율 오차항에 대하여 편미분한 것이 된다. 그 편미분계수들을 충격-반응 함수 IRF라고 한다.

 

3.2. 두 시계열의 오차항이 상관될 때: 촐레스키 분해를 이용한 테크닉

  • 그런데 사실 인플레이션율에 시점 1에서 충격이 발생했을 때 GDP 증가율의 시점 1 충격은 발생하지 않는다는 가정은 비현실적인 가정이다. 그래서 애초에 VAR 모형을 만들 때 두 시계열의 오차는 서로 공분산을 가질 수 있는 것으로 가정하였다.
  • 따라서 실제로 서로 공분산을 갖지 않는 오차항으로 이루어진 VMA(벡터 MA) 모형이 필요할 것이다. 그 과정을 간략하게 살펴보면, 먼저 공분산이 0이 아닐 수 있는 VMA 모형을 만든다.

 

$$\begin{bmatrix} P_{t} \\ Y_{t} \end{bmatrix} = \begin{bmatrix} \psi_{11} \psi_{12} \\ \psi_{21} \psi_{22} \end{bmatrix} \begin{bmatrix} \epsilon_{1,t-1} \\ \epsilon_{2,t-1} \end{bmatrix} + \begin{bmatrix} \epsilon_{1t} \\ \epsilon_{2t} \end{bmatrix}$$

  • 이때, 공분산이 0이 아닐 수 있으므로 오차항 벡터의 분포는

 

$$\begin{bmatrix} \epsilon_{1t} \\ \epsilon_{2t} \end{bmatrix} \sim w.n.(\vec{0}, \Sigma)$$

  • 여기서 촐레스키 분해(Cholesky Decomposition)이 개입한다. 공분산 행렬은 대칭이며 양정(Positive Definite) 행렬인데, 그러한 특징을 가지고 있는 행렬은 다음과 같이 분해될 수 있음이 알려져있다.

 

$\Sigma = LDL^{T} = PP^{T}$
$P = LD^{1/2}$

  • 행렬 $L$은 대각원소가 1인 하삼각행렬, $D$는 양의 원소를 갖는 대각행렬이다.

 

  • 이제 테크닉을 부려보자. 새로운 오차벡터 $\vec{\nu_{t}}$를 다음과 같이 정의하면, 이 새로운 오차벡터의 공분산행렬은 항등행렬이다. 즉 $\nu_{t}$는 공분산이 0이다.

 

$\vec{\nu_{t}} = P^{-1}\vec{\epsilon_{t}}$
$Var[\vec{\nu_{t}}] = P^{-1}\Sigma (P^{-1})^{T} = P^{-1}PP^{T}(P^{-1})^{T} = I$

  • 적당히 정의된 회귀계수 $\psi^{*}$에 대하여 VMA 모형은 다음과 같이 변형된다.

 

$$\begin{bmatrix} P_{t} \\ Y_{t} \end{bmatrix} = \begin{bmatrix} \psi^{*}_{11} \psi^{*}_{12} \\ \psi^{*}_{21} \psi^{*}_{22} \end{bmatrix} \begin{bmatrix} \nu_{1,t-1} \\ \nu_{2,t-1} \end{bmatrix} + \begin{bmatrix} \nu_{1t} \\ \nu_{2t} \end{bmatrix}$$

  • 이렇게 정의된 식에서는 오차공분산 가정에 영향을 받지 않고 충격반응함수를 구할 수 있다. 그리고 그 충격반응함수는 그냥 오차항의 계수가 된다. 촐레스키 분산분해는 주어진 시계열의 오차항을, 주어진 시계열에 영향을 주는 오차항과 다른 시계열에 영향을 주는 오차항을 분리하는 테크닉이라고 할 수 있다.

 

  • 앞서 다룬 콜금리와 CPI 간의 충격반응분석을 해보자. 각각은 주어진 시계열이 변화했을 때 이후 12개월 간 다른 시계열에 미치는 영향이다. 양의 값이면 플러스 영향, 음의 값이면 마이너스 영향을 의미한다. 아래 그림을 보면 솔직히 경제학적으로는 해석하기 어려운 결론이 나왔지만, 엄밀한 학술적 분석을 하는 것이 아니고 한 번 실습을 해보는 것이기 때문에 별 의미는 두지 않는다.
irf = forecast_model_fit.irf(12)
irf.plot()

 

3.3. 분산 분해(Variance Decomposition)

  • 촐레스키 분해로부터 얻은 VMA 모형에 대해서, 분산분해를 실시할 수 있다. 분산분해란 t 시점의 오차항이 t+k 시점의 시계열의 불확실성을 얼마나 설명하고 있는지를 측정한다.

 

  • i번째 시계열의 t+k 시점에서의 값을 예측할 때, 예측오차의 분산은 k 시점 동안 시계열의 변동성 혹은 불확실성을 나타낸다. 이 예측오차의 분산에서, j번째 시계열에 시점 t에 발생한 충격이 k 시점 동안 i 시계열에 미친 충격의 분산이 차지하는 비중을 구한다.
  • 이 비율은 i번째 시계열의 k 시점동안의 변동에서 j번째 시계열의 충격이 설명하는 비율을 의미한다. 즉 시계열의 상대적인 중요도이다.