2019년 5월 29일 수요일

Installing R Studion on Ubuntu 16.04 LTS

"rstudio error configuration failed for package xml2"

When you meet that kind of error message above, you can type the commend in terminal below

sudo apt-get install r-base-dev xml2 libxml2-dev libssl-dev libcurl4-openssl-dev unixodbc-dev

2019년 5월 28일 화요일

ARCH

출처 : https://blog.naver.com/wujuchoi

1. 배경
   - AutoRegressive Conditional Heteroskedasticity(자기회귀 조건부 이분산성)
   - 잔차, 백색잡음, 오류, innovation 주1 가 시계열에서 특정시점을 기준으로 이전 시점과 차이로 정의되고, 동일의미이며, 잔차(residual)라고 부르자.
   - 백색잡음의 분산으로 변동성을 표현하는 식
   - In 1982, Robert Engle에 의하며 발표되었다.

2. 의미
   - 특정시점의 값을 Xt라하면, 
   - Xt = sigma(편차) * Zt로 표현 가능, Zt는 N(0,1)를 따르는 분포이다.
   - Xt, Zt는 백색잡음(잔차)이나 동일하지 않다.
   - 파악하기) Xt는 N(0,1)을 따르는 분포의 편차 배로 표현해도 된다(가능하다)
   - 그러면, 백색잡음(잔차)의 분산을 sigma^2으로 표현하면,
     AR의 표기법처럼
   - sigma^2 = a0 + sum(ai * (Xt-i)^2), i=0부터 q까지
     로 표현가능하다.

3. 이해하는 과정
   - 식을 표현하는 과정에서, N(0,1)이라는 분포를 사용하는 점.
   - 분산을 AR  선형방정식으로부터 유도하지 않고,
     계수를 변경하여 비슷한 선형방정식으로 표현한다.
   - 만약 가정 중 Xt = sigma(편차) * Zt에서,
     sigma의 의미가 변동폭을 나타냄으로 sigma가 특정시점에
     커지면, 어떤 사건이 발생했다고 봐도 된다.

4. GARCH는?
   - ARCH 보완으로 
   - ARCH 선형방식에 분산을 추가하는 선형방정식을 만들어서 일반화하였다.

백색잡음

출처 : https://blog.naver.com/wujuchoi

1. 배경 
   : 시계열분석에서 정상시계열로 분석하는 과정에 필요한 과정 중 필요 요소 
   : 실 세계의 시계열 정보는 비정상시계열이므로 이를 정상시계열로 변경이 필요 

2. 의미 
   : 시계열 중 기준시점을 지정하고, 기준시점 이전과의 차이를 잡음이라고 한다. 
   : 예를 들면, 기준시점 값이 100이고, 기준시점 -1의 값이 95일때, 
     백색 잡음은 100 - 95 = 5가 된다. 
   : 시계열분석을 위해서 이 잡음을 확률변수가 I.I.D(Independently and Identically Distributed)를  
     따르면 백색잡음이라고 한다. 
   : 잡음을 I.I.D를 따르는 확률변수(백색잡음)로 과정을 정상화과정이라고 한다. 
   : 회귀분석에서 사용되는 잔차(Residual) 의미와 유사하다. 

3. lag(시차지연) 
   : 시계열분석을 위하여 백색잡음을 찾아가는 과정에 사용되는 요소 
   : 잡음을 정하기 위해서 lag를 1, 2, 3, ...들로 정할 수 있다. 

4. AR(AutoRegression) 이란  주1 
   : 기준일 값은 이전값들의 선형결합으로 구성된다고 가정 
   : 현재값 = sum(이전값i * 가중치i) + 잡음 (여기서 i=1 부터 p까지, p는 lag수, 기간 ) 

5. MA(Moving Average) 이란 주1 
   : 기준일 값은 이전값들과의 차이인 잡음들과의 선형결합으로 구성된다는 가정 
   : 현재값 = sum(잡음i * 가중치i) + 평균 (여기서 i=1 부터 p까지, p는 lag수, 기간 ) 

*IID(independent and identically distributed)
동전을 네 번 던지는 실험을 생각해보죠..
동전을 네 번 던지는 실험에서 매 던질 때 마다 관측되는 면을 나타내는 확률변수를 X1, X2, X3, X4  라고 하고, 앞면이 나오면 1, 뒷면이 나오면 0이라고 생각할 수 있습니다.
즉,  X1,X2, X3,X4 는 각각 독립적으로 값이 발생할 수 있으며, 각각 1이 나올 (즉, 동전이  앞면이 나올) 확률이 0.5, 0이 나올 (즉,  뒷면이 나올) 확률은 0.5로서 다 같습니다. 이런 의미에서  X1,X2, X3,X4 은 독립적이고 동일한 분포를 따른다고 할 수 있습니다 .

또 다른 실험을 생각하겠습니다.
1번부터 45번까지의공이 들어있는 상자에서 공을 다섯번 복원으로 뽑는다고 생각해보죠.
즉, 한 번 보고 다시 상자안에 넣는 경우입니다.
이럴 때, 각 뽑힌 공의 숫자를  X1, X2,X3, X4, X5  라고 하면,
제일 처음 나온 숫자가 다음 뽑힐 숫자에 영향을 주지 않습니다.
즉, X1,X2,X3,X4, X5 는 서로 독립이라고 할 수 있습니다.
그리고 처음 뽑히는 숫자 X1의 분포는 1부터 45까지 균일하게 1/45의 확률로 뽑힐 수 있습니다. 마찬가지로 두번째 뽑히는 숫자 X2도 X1과 상관없이 1부터 45까지 균일하게 1/45의 확률로 뽑힐 수 있습니다. 세번째,네번째, 다섯번째도 마찬가지입니다.
즉,  X1,X2,X3,X4, X5 각각 균일하게 1/45의 확률로 뽑히므로 동일한 분포를 가집니다.
결국 ,  X1,X2,X3,X4, X5 는 서로 독립이고 동일한 분포를 가지는 확률변수가 됩니다.