1. 배경
: 시계열분석에서 정상시계열로 분석하는 과정에 필요한 과정 중 필요 요소
: 실 세계의 시계열 정보는 비정상시계열이므로 이를 정상시계열로 변경이 필요
2. 의미
: 시계열 중 기준시점을 지정하고, 기준시점 이전과의 차이를 잡음이라고 한다.
: 예를 들면, 기준시점 값이 100이고, 기준시점 -1의 값이 95일때,
백색 잡음은 100 - 95 = 5가 된다.
: 시계열분석을 위해서 이 잡음을 확률변수가 I.I.D(Independently and Identically Distributed)를
따르면 백색잡음이라고 한다.
: 잡음을 I.I.D를 따르는 확률변수(백색잡음)로 과정을 정상화과정이라고 한다.
: 회귀분석에서 사용되는 잔차(Residual) 의미와 유사하다.
3. lag(시차지연)
: 시계열분석을 위하여 백색잡음을 찾아가는 과정에 사용되는 요소
: 잡음을 정하기 위해서 lag를 1, 2, 3, ...들로 정할 수 있다.
4. AR(AutoRegression) 이란 주1
: 기준일 값은 이전값들의 선형결합으로 구성된다고 가정
: 현재값 = sum(이전값i * 가중치i) + 잡음 (여기서 i=1 부터 p까지, p는 lag수, 기간 )
5. MA(Moving Average) 이란 주1
: 기준일 값은 이전값들과의 차이인 잡음들과의 선형결합으로 구성된다는 가정
: 현재값 = sum(잡음i * 가중치i) + 평균 (여기서 i=1 부터 p까지, p는 lag수, 기간 )
*IID(independent and identically distributed)
동전을 네 번 던지는 실험을 생각해보죠..
동전을 네 번 던지는 실험에서 매 던질 때 마다 관측되는 면을 나타내는 확률변수를 X1, X2, X3, X4 라고 하고, 앞면이 나오면 1, 뒷면이 나오면 0이라고 생각할 수 있습니다.
즉, X1,X2, X3,X4 는 각각 독립적으로 값이 발생할 수 있으며, 각각 1이 나올 (즉, 동전이 앞면이 나올) 확률이 0.5, 0이 나올 (즉, 뒷면이 나올) 확률은 0.5로서 다 같습니다. 이런 의미에서 X1,X2, X3,X4 은 독립적이고 동일한 분포를 따른다고 할 수 있습니다 .
또 다른 실험을 생각하겠습니다.
1번부터 45번까지의공이 들어있는 상자에서 공을 다섯번 복원으로 뽑는다고 생각해보죠.
즉, 한 번 보고 다시 상자안에 넣는 경우입니다.
이럴 때, 각 뽑힌 공의 숫자를 X1, X2,X3, X4, X5 라고 하면,
제일 처음 나온 숫자가 다음 뽑힐 숫자에 영향을 주지 않습니다.
즉, X1,X2,X3,X4, X5 는 서로 독립이라고 할 수 있습니다.
그리고 처음 뽑히는 숫자 X1의 분포는 1부터 45까지 균일하게 1/45의 확률로 뽑힐 수 있습니다. 마찬가지로 두번째 뽑히는 숫자 X2도 X1과 상관없이 1부터 45까지 균일하게 1/45의 확률로 뽑힐 수 있습니다. 세번째,네번째, 다섯번째도 마찬가지입니다.
즉, X1,X2,X3,X4, X5 각각 균일하게 1/45의 확률로 뽑히므로 동일한 분포를 가집니다.
결국 , X1,X2,X3,X4, X5 는 서로 독립이고 동일한 분포를 가지는 확률변수가 됩니다.
댓글 없음:
댓글 쓰기