통계/시계열

시계열 2장(2)

learning-log22 2025. 3. 16. 19:22

예측을 목적으로 하는 시계열 자료의 분석법

 

1. 시계열 회귀모형

: 시계열 자료에 (중)회귀분석 모형을 그대로 적용하는 경우

- 회귀분석: 두개 이상의 변수들 Z, X1, ···, Xp 사이의 상호관련성을 회귀모형에 의하여 분석하는 방법

$$ Z_t = f(X_t ; \beta) + \epsilon_t, t=1,2,...,n $$

Zt=종속/반응 변수, Xt=(Xt1,Xt2,...,Xtp)': 독립/설명 변수 (p개), f(·): Xt와 B의 함수

→ 오차항의 가정: ① 평균=0, 분산= σ^2, ② iid, ③ 정규분포를 따름

 

2. 최소제곱법에 의한 모수추정

- 최소제곱법: 오차제곱합을 최소로하는 B를 찾는 방법

$$ S(\beta) = \sum_t\epsilon_t^2 = \sum_t \left( {Z_t-f(X_t;\beta)}\right)^2 $$

3. 행렬을 이용한 중회귀모형 : 행렬과 벡터의 크기 파악 중요

$$ Z = X\beta + \epsilon $$

4. 최소제곱추정량의 성질

- 다중회귀분석 내용과 일치

 

5. 잔차분석

- 잔차(오차의 추정값)들을 분석하여 회귀모형이 자료를 잘 설명하는지 파악 (즉, 오차항에 대한 가정 3가지를 잘 만족하는지 판단)

- 잔차의 산점도를 그려봄으로써, 중회귀모형에 따르는 가정 검토

다음의 경우 조치 필요

(a) 회귀모형에 부가된 가정에 위배 X(모형 적절)

(b) 선형효과를 나타내는 항이 포함되어야 함

(c) 곡선효과(2차항)이 모형에 포함되어야 함

(d) 오차의 상수분산 가정에 위배 => 분산상수화(안정화)변환이 선행되어야 함 

(e),(f) 오차항들 강의 독립성 위베 => 자기상관관계 존재 -양/음의 상관관계

(d) 해결 : 분산상수화(안정화) 변환, (d); 시간의 흐름에 따라 퍼짐의 정도가 커짐

- 잔차의 분산이 시간의 흐름에 따라 종속되는 경향이 있을때, 오차항의 상수분산 가정에 위배되는 것 판단

→ 분산 상수화 변환: T(x) ∝ ∫1/√f(x)dx

→ 로그변환(제일 많이 이용) / 제곱근변환

→ 박스-칵스 변환

(e),(f) 해결 : 오차항의 자기 상관관계 검정

-best: 잔차들이 0을 중심으로 랜덤하게 but (e),(f)는 상관관계 존재 -> 오차항의 독립성 가정 의심

① 오차항들의 k차 자기 상관관계 검토 : 잔차들의 k차 표본자기상관계수(시차=1) 이용

→ 검정방법 : |2/√n| 을 넘으면 자기상관관계가 있는 것으로 판단 (자기상관계수(시차 1) ≠ 0) => 근사적 판단

- 시차 k≥1의 잔차자기상관계수도 마찬가지로 해석

② Durbin-Watson(DW) 통계량 =>1차

- 오차항들간의 자기상관 존재여부에 대한 유의성 검정 => 1차 자기상관관계가 유의한지 검정

-시차1 (1차) 자기상관을 고려 1) 귀무가설 H0: p=0 (오차항들 서로 독립)

D (DW 검정통계량) (1) p^=1이면 D≒0 (2)p^=-1이면 D≒4 (3)p^=0이면 D≒2이다.

즉, 양의 표본자기상관계수의 경우: 0≤D<2, 음의 표본자기상관계수의 경우: 2<D≤4

- 더 큰 차수의 검정은 "GDW"

 

6. 예측

- 시점 n까지 자료가 주어지고 l-시차 후 시점 t=n+l에서 관측될 미래값의 예측값으로 가장 널리 쓰이는 공식은 기댓값

- 최소평균제곱오차(MMSE)를 갖는 예측값의 정의: n시점까지 주어졌을때, n+l시점에서의 기대값 계산

 

 

'통계 > 시계열' 카테고리의 다른 글

시계열 4장(1)  (0) 2025.03.26
시계열 3장  (0) 2025.03.23
시계열 2장(3)  (0) 2025.03.19
시계열 2장(1)  (0) 2025.03.16
시계열 1장  (0) 2025.03.16