Matrix 안의 elements 들이 단순한 숫자들이 아닌 Random Variable 이라고 생각해보자.
그렇다면 평균과 분산등은 어떤식 으로 표현될까?
이번 포스팅은 Random Vectors 와 Random matrices의 특징등을 기술 하였다.
1. Expectation (평균)
▶ Expectation properties
만약 a 가 constants vector라면 , E[a]=a
만약 a 가 constant vector라면, E[aTy]=aTE[y]
만약 A 가 constant matrix 라면, E[Ay]=AE[y]
2. Variance (분산)
우선적으로 a random variable Y의 평균을 μ라 할 때 분산을 아래와 같이 적음을 상기시켜보자
E[(Y−μ)2]
Random variable을 element 로 가지는 Random vector y 의 분산 (covariance matrix)은 아래와 같다
var\ \textbf{y} =\mathbb{E}[(\textbf{y}-\boldsymbol{\mu})(\textbf{y}-\boldsymbol{\mu})^T]
▶Variance properties
\textbf{y} 를 random vector 라 하고, var\ \textbf{y} = \textbf{V} 라 하자.
만약 \textbf{a} 가 constant vector라면, var\ \textbf{a}^T\textbf{y} = \textbf{a}^T\textbf{V}\textbf{a}
만약 \textbf{A} 가 constance matrix 라면, var\ \textbf{Ay} = \textbf{AV}\textbf{A}^T
3. Multivariate Normal Distribution (MVN)
▶ linear model을 위한 정의
\textbf{z} \in \mathbb{R}^{k \times 1}, \textbf{A} \in \mathbb{R}^{n\times k}, \textbf{b} \in \mathbb{R}^{n\times 1} 이라고 하자.
\textbf{x} = \textbf{AX} + \textbf{b}
을 만족하는 \textbf{x} 는 multivariate normal distribution을 따른다
이때 \boldsymbol{\mu} = \textbf{b}, \boldsymbol{\Sigma} = \textbf{A}\textbf{A}^T 라 하면
아래와 같이 표현할 수 있다.
x \sim MVN(\boldsymbol{\mu}, \boldsymbol{\Sigma})
▶Linear combination of MVN 은 MVN 이다.
\textbf{x} \sim MVN(\boldsymbol{\mu}, \boldsymbol{\Sigma}) 일 때,
\textbf{y} = \textbf{AX} + \textbf{b}
를 만족하는 \textbf{y} 또한 MVN 을 만족하며 아래와 같다
\textbf{y} = \textbf{AX} + \textbf{b} \sim MVN(\textbf{A}\boldsymbol{\mu}+\textbf{b}, \textbf{A}\boldsymbol{\Sigma}\textbf{A}^T)
4. Random quadratic forms
▶expectation
\mathbb{E}[\textbf{y}] = \boldsymbol{\mu}, var\ \textbf{y} = \textbf{V} 라 하자
\mathbb{E}[\textbf{y}^T\textbf{Ay}] = tr(\textbf{AV}) + \boldsymbol{\mu}^T\textbf{A}\boldsymbol{\mu}
▶noncentral \chi^2 distribution
\textbf{y} \sim MVN(\boldsymbol{\mu}, \textbf{I})을 만족하는 k\times 1 random vector를 생각해보자
그렇다면 x = \textbf{y}^T\textbf{y} 을 만족하는 x는 noncentral \chi^2 distribution을 따르고
k degree of freedom 과 noncentrality parameter \lambda = \frac{1}{2}\boldsymbol{\mu}^T\boldsymbol{\mu}를 가진다.
x\sim \chi^2_{k,\lambda}
위의 내용을 적용하여 Linear model을 해석하기 위한 corollary를 살펴보자
\textbf{y} \sim MVN(\textbf{0}, \sigma^2\textbf{I}) 를 만족하는 n\times 1 random vector 와
n\times n을 만족하는 \textbf{A}가 주어지면
\frac{1}{\sigma^2}\textbf{y}^T\textbf{Ay}는 k degrees of freedom 과 noncentrality parameter \lambda = \frac{1}{2\sigma^2}\boldsymbol{\mu}^T\textbf{A}\boldsymbol{\mu}를 가지는 noncentral \chi^2 distribution을 가진다.
▶ var\ \textbf{y}가 \textbf{I} 아닌 경우
위의 경우는 random vector 간의 collinearity가 존재하는 경우를 의미하며,
\textbf{y} \sim MVN(\boldsymbol{\mu}, \textbf{V}) 이라 하면
\textbf{y}^T\textbf{Ay}는 k degree of freedom 과
noncentrality parameter \lambda = \frac{1}{2}\boldsymbol{\mu}^T\textbf{A}\boldsymbol{\mu}를 parameter로 포함하는 noncentral \chi^2 distribution을 가진다.
이 정의의 필요충분 조건은
\textbf{AV} 가 idempotent 하고 k rank를 가져야한다.
'호주 대학원 생존기 > Mathematics' 카테고리의 다른 글
[Computational Statistics] Confidence Interval of linear model parameters (선형모델-2) (0) | 2021.08.04 |
---|---|
[Computational Statistics] Linear model (선형모델) (0) | 2021.08.01 |
[Computational Statistics] Linear algebra for the linear models (선형모델해석을 위한 선형대수) (0) | 2021.07.27 |
[Numerical Analysis] Numerical Integration (0) | 2021.07.07 |
[Numerical Analysis] Polynomial Interpolation (0) | 2021.07.06 |