"rstudio error configuration failed for package xml2"
When you meet that kind of error message above, you can type the commend in terminal below
sudo apt-get install r-base-dev xml2 libxml2-dev libssl-dev libcurl4-openssl-dev unixodbc-dev
2019년 5월 29일 수요일
2019년 5월 28일 화요일
ARCH
출처 : https://blog.naver.com/wujuchoi
1. 배경
- AutoRegressive Conditional Heteroskedasticity(자기회귀 조건부 이분산성)
- 잔차, 백색잡음, 오류, innovation 주1 가 시계열에서 특정시점을 기준으로 이전 시점과 차이로 정의되고, 동일의미이며, 잔차(residual)라고 부르자.
- 백색잡음의 분산으로 변동성을 표현하는 식
- In 1982, Robert Engle에 의하며 발표되었다.
2. 의미
- 특정시점의 값을 Xt라하면,
- Xt = sigma(편차) * Zt로 표현 가능, Zt는 N(0,1)를 따르는 분포이다.
- Xt, Zt는 백색잡음(잔차)이나 동일하지 않다.
- 파악하기) Xt는 N(0,1)을 따르는 분포의 편차 배로 표현해도 된다(가능하다)
- 그러면, 백색잡음(잔차)의 분산을 sigma^2으로 표현하면,
AR의 표기법처럼
- sigma^2 = a0 + sum(ai * (Xt-i)^2), i=0부터 q까지
로 표현가능하다.
3. 이해하는 과정
- 식을 표현하는 과정에서, N(0,1)이라는 분포를 사용하는 점.
- 분산을 AR 선형방정식으로부터 유도하지 않고,
계수를 변경하여 비슷한 선형방정식으로 표현한다.
- 만약 가정 중 Xt = sigma(편차) * Zt에서,
sigma의 의미가 변동폭을 나타냄으로 sigma가 특정시점에
커지면, 어떤 사건이 발생했다고 봐도 된다.
4. GARCH는?
- ARCH 보완으로
- ARCH 선형방식에 분산을 추가하는 선형방정식을 만들어서 일반화하였다.
1. 배경
- AutoRegressive Conditional Heteroskedasticity(자기회귀 조건부 이분산성)
- 잔차, 백색잡음, 오류, innovation 주1 가 시계열에서 특정시점을 기준으로 이전 시점과 차이로 정의되고, 동일의미이며, 잔차(residual)라고 부르자.
- 백색잡음의 분산으로 변동성을 표현하는 식
- In 1982, Robert Engle에 의하며 발표되었다.
2. 의미
- 특정시점의 값을 Xt라하면,
- Xt = sigma(편차) * Zt로 표현 가능, Zt는 N(0,1)를 따르는 분포이다.
- Xt, Zt는 백색잡음(잔차)이나 동일하지 않다.
- 파악하기) Xt는 N(0,1)을 따르는 분포의 편차 배로 표현해도 된다(가능하다)
- 그러면, 백색잡음(잔차)의 분산을 sigma^2으로 표현하면,
AR의 표기법처럼
- sigma^2 = a0 + sum(ai * (Xt-i)^2), i=0부터 q까지
로 표현가능하다.
3. 이해하는 과정
- 식을 표현하는 과정에서, N(0,1)이라는 분포를 사용하는 점.
- 분산을 AR 선형방정식으로부터 유도하지 않고,
계수를 변경하여 비슷한 선형방정식으로 표현한다.
- 만약 가정 중 Xt = sigma(편차) * Zt에서,
sigma의 의미가 변동폭을 나타냄으로 sigma가 특정시점에
커지면, 어떤 사건이 발생했다고 봐도 된다.
4. GARCH는?
- ARCH 보완으로
- ARCH 선형방식에 분산을 추가하는 선형방정식을 만들어서 일반화하였다.
백색잡음
출처 : https://blog.naver.com/wujuchoi
1. 배경
: 시계열분석에서 정상시계열로 분석하는 과정에 필요한 과정 중 필요 요소
: 실 세계의 시계열 정보는 비정상시계열이므로 이를 정상시계열로 변경이 필요
2. 의미
: 시계열 중 기준시점을 지정하고, 기준시점 이전과의 차이를 잡음이라고 한다.
: 예를 들면, 기준시점 값이 100이고, 기준시점 -1의 값이 95일때,
백색 잡음은 100 - 95 = 5가 된다.
: 시계열분석을 위해서 이 잡음을 확률변수가 I.I.D(Independently and Identically Distributed)를
따르면 백색잡음이라고 한다.
: 잡음을 I.I.D를 따르는 확률변수(백색잡음)로 과정을 정상화과정이라고 한다.
: 회귀분석에서 사용되는 잔차(Residual) 의미와 유사하다.
3. lag(시차지연)
: 시계열분석을 위하여 백색잡음을 찾아가는 과정에 사용되는 요소
: 잡음을 정하기 위해서 lag를 1, 2, 3, ...들로 정할 수 있다.
4. AR(AutoRegression) 이란 주1
: 기준일 값은 이전값들의 선형결합으로 구성된다고 가정
: 현재값 = sum(이전값i * 가중치i) + 잡음 (여기서 i=1 부터 p까지, p는 lag수, 기간 )
5. MA(Moving Average) 이란 주1
: 기준일 값은 이전값들과의 차이인 잡음들과의 선형결합으로 구성된다는 가정
: 현재값 = sum(잡음i * 가중치i) + 평균 (여기서 i=1 부터 p까지, p는 lag수, 기간 )
*IID(independent and identically distributed)
동전을 네 번 던지는 실험을 생각해보죠..
동전을 네 번 던지는 실험에서 매 던질 때 마다 관측되는 면을 나타내는 확률변수를 X1, X2, X3, X4 라고 하고, 앞면이 나오면 1, 뒷면이 나오면 0이라고 생각할 수 있습니다.
즉, X1,X2, X3,X4 는 각각 독립적으로 값이 발생할 수 있으며, 각각 1이 나올 (즉, 동전이 앞면이 나올) 확률이 0.5, 0이 나올 (즉, 뒷면이 나올) 확률은 0.5로서 다 같습니다. 이런 의미에서 X1,X2, X3,X4 은 독립적이고 동일한 분포를 따른다고 할 수 있습니다 .
또 다른 실험을 생각하겠습니다.
1번부터 45번까지의공이 들어있는 상자에서 공을 다섯번 복원으로 뽑는다고 생각해보죠.
즉, 한 번 보고 다시 상자안에 넣는 경우입니다.
이럴 때, 각 뽑힌 공의 숫자를 X1, X2,X3, X4, X5 라고 하면,
제일 처음 나온 숫자가 다음 뽑힐 숫자에 영향을 주지 않습니다.
즉, X1,X2,X3,X4, X5 는 서로 독립이라고 할 수 있습니다.
그리고 처음 뽑히는 숫자 X1의 분포는 1부터 45까지 균일하게 1/45의 확률로 뽑힐 수 있습니다. 마찬가지로 두번째 뽑히는 숫자 X2도 X1과 상관없이 1부터 45까지 균일하게 1/45의 확률로 뽑힐 수 있습니다. 세번째,네번째, 다섯번째도 마찬가지입니다.
즉, X1,X2,X3,X4, X5 각각 균일하게 1/45의 확률로 뽑히므로 동일한 분포를 가집니다.
결국 , X1,X2,X3,X4, X5 는 서로 독립이고 동일한 분포를 가지는 확률변수가 됩니다.
1. 배경
: 시계열분석에서 정상시계열로 분석하는 과정에 필요한 과정 중 필요 요소
: 실 세계의 시계열 정보는 비정상시계열이므로 이를 정상시계열로 변경이 필요
2. 의미
: 시계열 중 기준시점을 지정하고, 기준시점 이전과의 차이를 잡음이라고 한다.
: 예를 들면, 기준시점 값이 100이고, 기준시점 -1의 값이 95일때,
백색 잡음은 100 - 95 = 5가 된다.
: 시계열분석을 위해서 이 잡음을 확률변수가 I.I.D(Independently and Identically Distributed)를
따르면 백색잡음이라고 한다.
: 잡음을 I.I.D를 따르는 확률변수(백색잡음)로 과정을 정상화과정이라고 한다.
: 회귀분석에서 사용되는 잔차(Residual) 의미와 유사하다.
3. lag(시차지연)
: 시계열분석을 위하여 백색잡음을 찾아가는 과정에 사용되는 요소
: 잡음을 정하기 위해서 lag를 1, 2, 3, ...들로 정할 수 있다.
4. AR(AutoRegression) 이란 주1
: 기준일 값은 이전값들의 선형결합으로 구성된다고 가정
: 현재값 = sum(이전값i * 가중치i) + 잡음 (여기서 i=1 부터 p까지, p는 lag수, 기간 )
5. MA(Moving Average) 이란 주1
: 기준일 값은 이전값들과의 차이인 잡음들과의 선형결합으로 구성된다는 가정
: 현재값 = sum(잡음i * 가중치i) + 평균 (여기서 i=1 부터 p까지, p는 lag수, 기간 )
*IID(independent and identically distributed)
동전을 네 번 던지는 실험을 생각해보죠..
동전을 네 번 던지는 실험에서 매 던질 때 마다 관측되는 면을 나타내는 확률변수를 X1, X2, X3, X4 라고 하고, 앞면이 나오면 1, 뒷면이 나오면 0이라고 생각할 수 있습니다.
즉, X1,X2, X3,X4 는 각각 독립적으로 값이 발생할 수 있으며, 각각 1이 나올 (즉, 동전이 앞면이 나올) 확률이 0.5, 0이 나올 (즉, 뒷면이 나올) 확률은 0.5로서 다 같습니다. 이런 의미에서 X1,X2, X3,X4 은 독립적이고 동일한 분포를 따른다고 할 수 있습니다 .
또 다른 실험을 생각하겠습니다.
1번부터 45번까지의공이 들어있는 상자에서 공을 다섯번 복원으로 뽑는다고 생각해보죠.
즉, 한 번 보고 다시 상자안에 넣는 경우입니다.
이럴 때, 각 뽑힌 공의 숫자를 X1, X2,X3, X4, X5 라고 하면,
제일 처음 나온 숫자가 다음 뽑힐 숫자에 영향을 주지 않습니다.
즉, X1,X2,X3,X4, X5 는 서로 독립이라고 할 수 있습니다.
그리고 처음 뽑히는 숫자 X1의 분포는 1부터 45까지 균일하게 1/45의 확률로 뽑힐 수 있습니다. 마찬가지로 두번째 뽑히는 숫자 X2도 X1과 상관없이 1부터 45까지 균일하게 1/45의 확률로 뽑힐 수 있습니다. 세번째,네번째, 다섯번째도 마찬가지입니다.
즉, X1,X2,X3,X4, X5 각각 균일하게 1/45의 확률로 뽑히므로 동일한 분포를 가집니다.
결국 , X1,X2,X3,X4, X5 는 서로 독립이고 동일한 분포를 가지는 확률변수가 됩니다.
피드 구독하기:
글 (Atom)