http://kostat.go.kr/wnsearch/search.jsp
통계청 수출입물가조사 데이터를 이용해서 1971년~2019년 데이터를 가지고 시계열 데이터 분석을 해보려고 한다.
loc를 이용해서 원하는 부분만을 불러온 다음에 plot을 이용해서 그래프를 그릴수도 있지만
seaborn에 있는 relplot을 이용해서 시계열 그래프를 그려본다.
물가지수의 연도별 상승률을 시계열 그래프로 그려보았 을 때 평균과 분산이 변하는 비정상 시계열이다.
단순이동평균법(simple moving average)은
가장 최근의 m-기간 동안의 자료들의 단순평균을 이용하여 다음 기간을 예측하는 방법이며
최근의 새로운 자료들이 첨가되어도 단순평균값에 거의 영향을 주지 못할 뿐만 아니라 많은 양의 자료들이 계산속에 포함되어야 한다는 단점을 가지고 있다.
단순평균법으로 2개의 연도의 평균을 구한뒤
m=5일때 단순평균법의 값들의 5개의 평균을 구하는 것이 예측값이 된다.
단순평균법으로 2020년도의 예측값을 구해보면 100.538이 된다.
단순지수평활법은 모든 자료를 사용하여 예측값을 구하고, 예측값을 구할 때 가장 최근의 자료에 가장 큰 가중치를 주고 과거로 갈수록 가중치를 지수적으로 줄여나가는 방법으로
전체 자료가 아닌 최근 개의 자료만을 사용하여 예측값을 구하고, 또한 이들 개의 자료에 대하여 동일한 가중치를 부여해야한다는 단점이 있다
초기값 F1의 선택에 있어서 자료의 개수 n이 큰 경우에는 초기값은 중요한 역할을 하지 않고
전체 자료의 표본평균 사용, 최초의 관측값 사용 , 최초의 6개의 관측값의 평균 사용,
후향예측값 사용을 할 수 있다.
평활 상수 w의 역할과 선택이 중요한데
브라운은 0.05와 0.3 사이의 평활상수를 선택할 것을 제안했으며
예측오차의 제곱의 평균을 최소로 하는 w를 선택하는 것이 좋다.
또한, 평활상수의 값이 작으면 평활의 효과가 크고, 평활상수의 값이 크면 변화에 대해 민감하게 반응한다.
단순지수평활법의 공식을 이용해서 2020년도의 예측값을 구해보면 105.255가 나온다.
'Data Analysis' 카테고리의 다른 글
[크롤링 오류]This version of ChromeDriver only supports Chrome version (1) | 2020.06.16 |
---|---|
[시계열] 홀트의 선형지수평활법, Holt-winter의 계절지수평활법 (0) | 2020.04.22 |
[김해시] 화재발생 예측모델 개발_모델링_tpot & 결과 (0) | 2019.12.16 |
[김해시] 화재발생 예측모델 개발 _모델링_RFE (0) | 2019.12.16 |
[김해시] 화재발생 예측모델 개발 _모델링_GridSearchCV, pipeline (0) | 2019.12.15 |