분류 전체보기 78

2021년도에 들은 수업들을 돌아보며

작년에는 처음 입학해서 확률론, 기초통계학들을 들었던 반면, 올해는 조금더 수리생물에 응용된 학문들을 신청해서 들을 수 있게 되었다. 올해도 작년과 같이 8개의 과목을 일년동안 이수했는데 이수한 과목들과 생각을 적어보는 시간을 가질까 한다. MAST20029 Engineering Mathematics (공학수학) 공학수학은 딱히 들을 생각은 없었지만 시스템생물학의 선수강 과목이라 여름학기로 부랴부랴신청해서 수강한 2021년도 첫 과목이였다. 한달동안 엄청 빠르게 해석학, 미분방정식, 편미분방정식, 라플라스, 퓨리에 변환등을 넘어가기 때문에 한달이 어떻게 지나가는 지도 모르게 공부했었던것 같다. BINF90001 Statistics for Bioinformatics (생명정보통계학) 생명정보학과 코어 수업..

백테스팅 데이터 처리 (From investing.com)

Investing.com 에서 ETF 가격데이터를 끌어와 백테스팅에 이용하자 지난번 포스팅에서 backtesting.py를 이용하기 위하여 OHLC data (시가,고가,저가,종가 가 포함된 데이터) 가 필요하다라는 것을 살펴보았고 backtesting.py 튜토리얼을 통해 quandl 과 같은 사이트들을 이용하여 데이터를 얻을 수 있음을 알게 되었다. 그래서 뒤적뒤적 해본결과, Quandl은 데이터들을 많이 있었지만, 내가 원하는 호주 주가지수인 ASX200 에 관한 가격정보는 찾기힘들뿐더러, 꼭 free도 아니였다. 결국 그냥 Investing.com에서 데이터를 끌어와 조금 전처리를 하고 쓰기로 했다. 그 과정을 공유하고자 한다. investing.com에 들어가자 https://www.invest..

파이썬 백테스팅 패키지 (backtesting.py)

backtesting 을 수행할 수 있는 backtesting.py 패키지에 대하여 알아보자 최근 변동성을 어떤 식으로 표현하는지에 관심이 생겨 일명 공포지수라고 불리는 VIX에 관해 공부를 하던 중 흥미로운 파이썬 패키지를 발견하여 한번 튜도리얼을 따라해보았다 https://kernc.github.io/backtesting.py/doc/backtesting/#gsc.tab=0 backtesting API documentation Package backtesting Manuals Tutorials These tutorials are also available as live Jupyter notebooks: In Colab, you might have to !pip install backtesting. E..

[Computational Statistics] Fisher Information

Estimator 의 efficiency 를 설명할 때 필요한 Fisher Information 에 대한 내용을 다룬 포스팅이다. 1. Motivation parameter estimation problem을 푸는 과정에서 우리는 sample 데이터를 이용한 정보를 활용하게 된다. 그렇다면 알지 못하는 parameter에 대하여 sample data는 얼마나 많은 정보를 제공할 수 있는가? 에 대한 질문을 해볼 수 있다. random variable $X\sim f(x|\theta)$ 에 관하여 만약 $\theta$ 가 true value 인 경우, log-likelihood의 파라이터에 관한 1차 미분은 0 에 근접한다. (기본적인 Maximum likelihood estimation 하는 방법이다.)..

[Computational Statistics] Confidence Interval of linear model parameters (선형모델-2)

지난번 포스팅인 선형모델을 통하여 Least square estimator $\textbf{b}$를 구해보고 이것의 평균과 분산을 알아보는 시간을 가졌다. 이번시간에는 더 나아가 interval estimation을 하는 방법들을 살펴보자 아직까지는 Full rank model 만을 생각한다. 우선 지난번 포스팅을 통해 확인하였던 $\textbf{b}$의 평균과 분산을 다시 상기 시켜보자 $$\mathbb{E}[\textbf{b}] = \boldsymbol{\beta}$$ $$Var\ \textbf{b} = \left ( \textbf{X}^T \textbf{X} \right )^{-1} \sigma^2$$ 하지만 우리는 보통 $\sigma$에 대한 정보를 모르기 때문에 $\sigma$를 estimati..

[수익] 21.08.03 제이티 +869,611

이번학기 첫 수익입니다. 빠밤 사실 좀 더 욕심을 부려서 두자리 수익률 까지 기다려보고자 했으나 새로운 투자전략을 시도해 보고싶어 후다닥 현금화를 하였습니다. 다른 종목들도 올라주어서 이번 학기 투자가 잘 마무리 되면 좋겠네요. 모두들 성투하시기를 바랍니다. 2020년 2월이후 총 순수익 + 9,456,621

[Computational Statistics] Linear model (선형모델)

지난 포스팅에서 다룬 랜덤벡터들의 성질을 이용하여 선형 모델의 Matrix form을 나타내보고, parameter들을 fitting하는 방법인 method of least squsres를 살펴보고자 한다. 1. Full rank linear model full rank 모델은 design matrix $X$ 즉 데이터 들이 담겨있는 matrix $\textbf{X}$ 가 full rank를 가짐을 의미한다 $$r(\textbf{X}) = k+1$$ 이는 다른말로 $\textbf{X}^T\textbf{X}$가 invertible 하다는 의미이다. 2. Model assumption $$\textbf{y} = \textbf{X}\boldsymbol{\beta} + \boldsymbol{\epsilon}$$..

[Computational Statistics] Random Vectors (랜덤 벡터)

Matrix 안의 elements 들이 단순한 숫자들이 아닌 Random Variable 이라고 생각해보자. 그렇다면 평균과 분산등은 어떤식 으로 표현될까? 이번 포스팅은 Random Vectors 와 Random matrices의 특징등을 기술 하였다. 1. Expectation (평균) ▶ Expectation properties 만약 $\textbf{a}$ 가 constants vector라면 , $\mathbb{E}[\textbf{a}] = \textbf{a}$ 만약 $\textbf{a}$ 가 constant vector라면, $\mathbb{E}[\textbf{a}^T\textbf{y}] = \textbf{a}^T\mathbb{E}[\textbf{y}]$ 만약 $\textbf{A}$ 가 cons..

[Computational Statistics] Linear algebra for the linear models (선형모델해석을 위한 선형대수)

왜 선형대수를 공부하는 것이 Linear model 들을 이해하는 데 도움이 될까? 이는 Confidence Interval을 구하기 위해서 평균(expectation) 혹은 분산(Variance) 또는 확률들을 구하여야 하는데, 데이터는 vector 혹은 matrices의 형태로 저장이 되기 때문에 이들의 연산을 수행하는 것이 필수적이다. 이번 포스팅은 이러한 Linear model들을 이해하기 위한 기본적인 선형대수들을 복습하는 포스팅이다. 너무 기초적인 내용들은 생략하였다. 1. Basics ▶ Dot product (설명 생략) ▶ Transposition $$(\textbf{X}^T)^T = \textbf{X}$$ $$(\textbf{XY})^T = \textbf{Y}^T\textbf{X}^T$..

계산생물학 석사 2학년 2학기 수강과목들 (어떤 과목을 수강취소할까?)

지난학기 나는 아래와 같은 4과목을 수강하였다. BNIF90001 Statistics for Bioinformatics BMEN90027 Systems and Synthetic Biology COMP90016 Computationa Genomics MAST90127 Advanced Biological Modelling: Dynamics. 테크니컬하게는 작년부터 한학기당 4개의 과목을 들어온적은 없었는데 (그렇다, 나는 1학년 2학기때 아무생각없이 Stochastic modeling 이라는 과목을 신청했다가 눈물의 수강드랍을 하였다.) 각각의 과목마다 3개혹은 4개씩의 코딩 및 에세이를 쓰는 과제들이 있어 한 학기가 어떻게 지나가는지 모르게 과제만 하며 후다닥 지나가 버렸다. 1학기에는 참 기분이 이상한 ..

반응형