전체 글 106

시계열 분석 #11: VAR 모형의 이슈들

전 포스팅에서 VAR의 기본 골격을 살펴보았다. 여기서는 VAR 모형을 풍부하게 만들어주는 추가적인 이슈들을 고려한다. 1. 구조적 벡터자기회귀모형(SVAR; Structural VAR) 이전 포스팅에서 다룬 VAR은 Reduced Form VAR이라고 한다. 축소모형이라고도 부른다. 계량경제학 모형에서 Structural과 Reduced의 구분은 그 모형이 경제학 이론을 반영한 계량 모형인지 혹은 단지 복수의 변수 간의 관찰된 통계적 상관성만을 기술하는 모형인지에 따른 것이다. 전자이면 Structural, 후자이면 Reduced이다. 가령 인플레이션율과 GDP 증가율을 VAR 모형으로 추정한다고 하자. reduced from VAR는 다음과 같이 경제이론에 대한 고려 없이 단순하게 두 변수로 구성된 ..

Deep Learning #1 딥러닝 기초: 심층신경망의 구조와 간단 코드 실습

1. Deep Neural Net 딥러닝(Deep Learning)이란 인공신경망(Artificial Neural Net)을 훈련해 회귀나 분류 문제 등을 해결하는 것을 말한다. 인공신경망은 심층신경망(Deep Neural Net) 또는 다층퍼셉트론(Multi-Layer Perceptron)이라고도 불린다. 굳이 구분할 필요는 없이 다 같은 개념으로 사용해도 된다고 본다. 심층신경망은 다음의 요소들로 구성된다. 인풋 레이어(Input Layer): 주어진 데이터가 벡터(Vector) 형태로 입력된다. 이를 인풋 벡터(Input Vector)라고도 말하며, 인풋 벡터 그 자체는 심층신경망의 입장에서는 인풋 레이어가 된다. 히든 레이어(Hidden Layer): 인풋 레이어와 아웃풋 사이를 매개하는 레이어...

시계열 분석 #10 벡터자기회귀(VAR)

GitHub - SeungbeomDo/Time_Series_Analysis: Practical Codes for Time Series Modeling and Analysis Practical Codes for Time Series Modeling and Analysis - GitHub - SeungbeomDo/Time_Series_Analysis: Practical Codes for Time Series Modeling and Analysis github.com 1. 벡터 시계열 1.1. 벡터 시계열의 도입 이전 포스팅에서 다루었던 ARMA 모델 등은 단변량 시계열을 분석하는 모델이었다. 가령 주가 시계열 $\{X_{t}\}$은 주식의 가격이라는 하나의 대상을 시간에 걸쳐 관측한 값의 집합이다. $$\{..

파생상품 이론 #8 이항모형

이 시리즈는 파생상품 이론 분야에서 가장 유명한 교재인 Hull(2021)의 "Options, Futures and Other Derivatives (11th)"을 요약한 것일 뿐이다. 아래는 책 구매 링크 https://www.pearson.com/en-us/subject-catalog/p/options-futures-and-other-derivatives/P200000005938/9780136939917 7편 파생상품 이론 #7 옵션의 성질 이 시리즈는 파생상품 이론 분야에서 가장 유명한 교재인 Hull(2021)의 "Options, Futures and Other Derivatives (11th)"을 요약한 것일 뿐이다. 아래는 책 구매 링크 Options, Futures, and Other Der..

Machine Learning #5 클러스터링 : 근로자 임금 분포 클러스터링

1. 클러스터링의 개요 클러스터링(Clustering)이란 샘플 내의 대상들을 일정하게 분류하는 비지도학습 과제를 말한다. 가령 아래와 같은 2차원 변수 공간에 샘플들이 분포하고 있을 때, 샘플들을 각각의 집단으로 묶어내는 작업이다. 위 그림과 같은 상황에서, 직관적으로 세 개의 클러스터로 묶어내고 싶다는 생각이 들 것이다. 그러나 그런 기준들은 연구자의 직관에 의존하고 있어서 임의적이라는 한계를 갖는다. 클러스터링 기법들을 활용하면 임의성의 문제를 극복하고 샘플들을 일관적이고 합리적인 방식으로 묶어낼 수 있다. 나아가서 서로 특성이 다른 샘플들을 서로 다른 클러스터로 분류해 놓은 후에, 각 클러스터들이 어떤 특징을 갖는지 인사이트를 얻어낼 수 있다. 또는 원래 주어진 문제가 회귀 문제였다면, 샘플 전체..

시계열 분석 #9 ARCH & GARCH

GitHub - SeungbeomDo/Time_Series_Analysis: Practical Codes for Time Series Modeling and Analysis Practical Codes for Time Series Modeling and Analysis - GitHub - SeungbeomDo/Time_Series_Analysis: Practical Codes for Time Series Modeling and Analysis github.com 1. 변동성의 자기상관 시계열 모형에서 오차항은 말그대로 오차, 즉 예측불가능한 시계열 요소로 간주된다. 그러나 오차항 자체가 아닌 오차항의 '분산'은 예측할 수 있다는 것이 많은 시계열 데이터에서 관찰되는 사실이다. 특히 금융 시계열에서 그러한..

Machine Learning #4 차원 축소 : 신용카드 연체 여부 예측

1. 차원 축소(Dimensionality Reduction) 대부분 데이터 분석의 궁극적인 목표는 종속변수 $Y$를 일련의 독립변수 집합 $[X_{1}, X_{2}, ... , X_{n}]$으로 설명하는 것이다. 그런데 이때 사용하는 독립변수 벡터의 차원이 너무 많으면 여러가지로 문제가 발생한다. 불필요한 혹은 다른 변수들과 유의한 차이가 없는 독립변수들이 포함되면 모형의 성능이 저하된다. 너무 많은 독립변수들을 고려하다보니 계산 비용이 증가한다. 비전문가에게 분석 결과를 이해시키는 직관적인 방법은 시각화인데, 변수 공간이 3차원 이상이 되면 시각화를 하기가 매우 어렵다. 따라서 모형이 사용할 독립변수들을 줄이는 것은 매우 중요한 과제라고 하겠다. 이때 독립변수 벡터의 차원을 줄인다고 해서, 이 과정을..

파생상품 이론 #7 옵션의 성질

이 시리즈는 파생상품 이론 분야에서 가장 유명한 교재인 Hull(2021)의 "Options, Futures and Other Derivatives (11th)"을 요약한 것일 뿐이다. 아래는 책 구매 링크 Options, Futures, and Other Derivatives ISBN-13: 9780136939979 Options, Futures, and Other Derivatives Published 2021 www.pearson.com 6편 파생상품 이론 #6 스왑 이 시리즈는 파생상품 이론 분야에서 가장 유명한 교재인 Hull(2021)의 "Options, Futures and Other Derivatives (11th)"을 요약한 것일 뿐이다. 아래는 책 구매 링크 Options, Future..

시계열 분석 #8 Auto ARIMA & Backtesting

1. Auto ARIMA 저번 포스팅에서는 ARIMA 모델의 계수 p,d,q를 정할 때 ACF 및 PACF를 확인해서 정하는 방법을 소개했다. 그런데 이는 이론적인 것일 뿐 그렇게 만들어진 모델이 정말 좋은 성능을 내는 것은 아니다. 아마 가장 확실한 방법은 직접 여러 후보 파라미터셋들에 대하여 모델을 하나하나 만들어보고 비교하는 것이다. 이를 수행해주는 라이브러리를 소개한다. !pip install pmdarima import pmdarima as pm data_auto = data.copy().iloc[:, :3] data_auto.head(5) model = pm.auto_arima(y = data_auto['Return'] , d = 0 , start_p = 0 , max_p = 3 , start..

Machine Learning #3 Decision Tree & Ensemble : 신용카드 연체 예측

GitHub - SeungbeomDo/DataAnalysis: Practical Codes for Data Analysis using Machine Learning and Deep Learning Practical Codes for Data Analysis using Machine Learning and Deep Learning - GitHub - SeungbeomDo/DataAnalysis: Practical Codes for Data Analysis using Machine Learning and Deep Learning github.com 1. Decision Tree의 개요 분류 문제에 자주 사용되는 머신러닝 방법론인 Decision Tree를 설명한다. Decision Tree는 스무고개와 같은..