2019년 5월 28일 화요일

백색잡음

출처 : https://blog.naver.com/wujuchoi

1. 배경 
   : 시계열분석에서 정상시계열로 분석하는 과정에 필요한 과정 중 필요 요소 
   : 실 세계의 시계열 정보는 비정상시계열이므로 이를 정상시계열로 변경이 필요 

2. 의미 
   : 시계열 중 기준시점을 지정하고, 기준시점 이전과의 차이를 잡음이라고 한다. 
   : 예를 들면, 기준시점 값이 100이고, 기준시점 -1의 값이 95일때, 
     백색 잡음은 100 - 95 = 5가 된다. 
   : 시계열분석을 위해서 이 잡음을 확률변수가 I.I.D(Independently and Identically Distributed)를  
     따르면 백색잡음이라고 한다. 
   : 잡음을 I.I.D를 따르는 확률변수(백색잡음)로 과정을 정상화과정이라고 한다. 
   : 회귀분석에서 사용되는 잔차(Residual) 의미와 유사하다. 

3. lag(시차지연) 
   : 시계열분석을 위하여 백색잡음을 찾아가는 과정에 사용되는 요소 
   : 잡음을 정하기 위해서 lag를 1, 2, 3, ...들로 정할 수 있다. 

4. AR(AutoRegression) 이란  주1 
   : 기준일 값은 이전값들의 선형결합으로 구성된다고 가정 
   : 현재값 = sum(이전값i * 가중치i) + 잡음 (여기서 i=1 부터 p까지, p는 lag수, 기간 ) 

5. MA(Moving Average) 이란 주1 
   : 기준일 값은 이전값들과의 차이인 잡음들과의 선형결합으로 구성된다는 가정 
   : 현재값 = sum(잡음i * 가중치i) + 평균 (여기서 i=1 부터 p까지, p는 lag수, 기간 ) 

*IID(independent and identically distributed)
동전을 네 번 던지는 실험을 생각해보죠..
동전을 네 번 던지는 실험에서 매 던질 때 마다 관측되는 면을 나타내는 확률변수를 X1, X2, X3, X4  라고 하고, 앞면이 나오면 1, 뒷면이 나오면 0이라고 생각할 수 있습니다.
즉,  X1,X2, X3,X4 는 각각 독립적으로 값이 발생할 수 있으며, 각각 1이 나올 (즉, 동전이  앞면이 나올) 확률이 0.5, 0이 나올 (즉,  뒷면이 나올) 확률은 0.5로서 다 같습니다. 이런 의미에서  X1,X2, X3,X4 은 독립적이고 동일한 분포를 따른다고 할 수 있습니다 .

또 다른 실험을 생각하겠습니다.
1번부터 45번까지의공이 들어있는 상자에서 공을 다섯번 복원으로 뽑는다고 생각해보죠.
즉, 한 번 보고 다시 상자안에 넣는 경우입니다.
이럴 때, 각 뽑힌 공의 숫자를  X1, X2,X3, X4, X5  라고 하면,
제일 처음 나온 숫자가 다음 뽑힐 숫자에 영향을 주지 않습니다.
즉, X1,X2,X3,X4, X5 는 서로 독립이라고 할 수 있습니다.
그리고 처음 뽑히는 숫자 X1의 분포는 1부터 45까지 균일하게 1/45의 확률로 뽑힐 수 있습니다. 마찬가지로 두번째 뽑히는 숫자 X2도 X1과 상관없이 1부터 45까지 균일하게 1/45의 확률로 뽑힐 수 있습니다. 세번째,네번째, 다섯번째도 마찬가지입니다.
즉,  X1,X2,X3,X4, X5 각각 균일하게 1/45의 확률로 뽑히므로 동일한 분포를 가집니다.
결국 ,  X1,X2,X3,X4, X5 는 서로 독립이고 동일한 분포를 가지는 확률변수가 됩니다.




댓글 없음:

댓글 쓰기