지난 포스팅에서 다룬 랜덤벡터들의 성질을 이용하여 선형 모델의 Matrix form을 나타내보고,
parameter들을 fitting하는 방법인 method of least squsres를 살펴보고자 한다.
1. Full rank linear model
full rank 모델은 design matrix X 즉 데이터 들이 담겨있는 matrix X 가 full rank를 가짐을 의미한다
r(X)=k+1
이는 다른말로 XTX가 invertible 하다는 의미이다.
2. Model assumption
y=Xβ+ϵ
이와 같은 선형모델을 생각해보자 이때 error vector ϵ은 다음과 같이 가정한다
ϵ∼N(0,σ2I)
선형모델에서 error vector만 random term 을 가지므로
(frequentist approach, bayesian 인 경우에는 $\boldsymbol{\beta$} 도 random vector로 고려할 것이다)
E[y]=Xβ
Var y=σ2I
3. Least squares estimates
▶ parameter estimation
구하고자 하는 parameter vector를 b, residuals를 e라 하자
parameter vector b를 구하는 방법은 square sum of residuals를 최소화 하면 된다.
eTe=(y−Xb)T(y−Xb)=y2y−yTXb−bTXTy+bTXTTb=yTy−2yTXb+bTXTXb=yTy−2(XTy)Tb+bT(XTX)b
두번째 식에서 세번째 식으로 넘어가는것이 한번에 이해하기 어려운데 이는 yTXb 값이 scalar 이므로 symmetic하기 때문에 가능하다. (yTXb=bTXTy)
이식을 minimize하기 위하여 아래의 식을 구하면
∂eTe∂b=0
다음과 같다.
−2XTy+2(XTX)b=0
만약 vector differentiaion이 익숙하지 않다면 아래의 포스팅의 맨 마지막 부분을 참고하자
[Computational Statistics] Linear algebra for the linear models (선형모델해석을 위한 선형대수)
왜 선형대수를 공부하는 것이 Linear model 들을 이해하는 데 도움이 될까? 이는 Confidence Interval을 구하기 위해서 평균(expectation) 혹은 분산(Variance) 또는 확률들을 구하여야 하는데, 데이터는 vector..
bright-ocean.tistory.com
이를 정리하면 parameter vector b가 아래와 같은 식을통해 estimation될 수 있음을 알 수 있다.
b=(XTX)−1XTy
4. Orthongonal property
▶ Residuals orthogonal to the column space of X
Xb는 X의 column space 안에 존재하는 어떤 vector를 의미한다.
그렇다면 residual vector와의 관계는 무엇인가?
Column space of X 와 residual vector y−Xb를 생각해보자
3. 에서 구한 b=(XTX)−1XT를 이용하여
Xb 와 residual 인 y−Xb의 inner product를 구하면
(Xb)T(y−X(XTX)−1XT)y
=bT(XT−XTX(XTX)−1XT)y=0
즉 residual vector 와 column space of X는 orthogonal 하다
▶Geometric interpretation of least squares
바로 위에서 본 orthogonality를 이용하여 geometic interpretation을 해보면 다음과 같다

본 그림은 위키피이아에서 퍼온 것인데 ˆβ 이 b와 같으므로,
즉 선형모델은 y를 column space of X에 projection한 것과 같음을 알수있다.
▶Mean and Variance of b
E[b]=E[(XTX)−1XTy]=(XTX)−1XTE[y]=(XTX)−1XT(Xβ)=β
Var b=Var (XTX)−1XTy=(XTX)−1XTσ2I((XTX)−1XT)T=(XTX)−1XTX((XTT)T)−1σ2=(XTX)−1σ2
'호주 대학원 생존기 > Mathematics' 카테고리의 다른 글
[Computational Statistics] Fisher Information (0) | 2021.08.20 |
---|---|
[Computational Statistics] Confidence Interval of linear model parameters (선형모델-2) (0) | 2021.08.04 |
[Computational Statistics] Random Vectors (랜덤 벡터) (0) | 2021.07.28 |
[Computational Statistics] Linear algebra for the linear models (선형모델해석을 위한 선형대수) (0) | 2021.07.27 |
[Numerical Analysis] Numerical Integration (0) | 2021.07.07 |