본문 바로가기

전체 글

(184)
[ProDS] 7. 그래프에 의한 기술통계 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 데이터 시각화 - 질적 자료(명목형, 순서형)인 경우 1) 변수 1개 : Bar chart, Pie chart ... 2) 변수 2개 사이의 연관성 : Heat map, Stacked column chart... - 양적(=숫자형) 자료(이산형 및 연속형) 1) 변수 1개 : Histogram, Box plot, Line chart, QQ plot 2) 변수 2개 사이의 연관성 : Scatter plot
[ProDS] 6. 카이제곱분포, t분포 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 카이제곱분포 1) 정의 : $Z_1,\, Z_2,\, \cdots Z_k$가 $k$개의 서로 독립인 표준정규확률변수라 할 때 $$X={Z_1}^2+{Z_2}^2+\cdots +{Z_k}^2$$ 가 따르는 분포를 자유도가 k인 카이제곱분포라 정의하며 확률분포함수는 $$ f(x)=\frac{1}{\Gamma(\frac{1}{2})2^{\frac{k}{2}}}x^{\frac{k}{2}-1}e^{-\frac{x}{2}}\quad (0C)=\alpha$를 만족하는 특정 값 $C$를 $(1-\alpha)$분위수라 하고, $t_{\alpha,\, k}$로 표기한다.
[ProDS] 5. 정규분포, 표준 정규분포 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 정규분포$ Normal distribution $ 1) 정의 : 확률변수 $X$가 평균이 $ \mu $, 분산이 $ \sigma ^2 $이고 확률밀도함수 $ f(x) $가 $$f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{\frac{-{(x-\mu)^2}}{2\sigma^2}}\quad (-\infty E(Z) = E(\frac{1}{\sigma}X\, -\frac{\mu}{\sigma}) = \frac{1}{\sigma}E(x)-\, \frac{\mu}{\sigma} = \frac{1}{\sigma}\, -\frac{\mu}{\sigma} = 0$$ $$V(ax+b) = a^2V(x)\, => V(Z) = V(\frac..
[ProDS] 4. 이항분포, 포아송분포, 지수분포 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. - 베르누이 시행 : 매 시행의 결과가 성공 or 실패이며, 성공확률이 $p$로 일정한 시행을 말한다. ex) 동전을 하나 던지는 실험. $ S= \left\{H,\, T \right\} $, $ P(H) =$ 1/2 - 이항분포 : 베르누이 시행을 독립적으로 $n$번 반복할 때의 확률분포. ex) 동전 하나를 세 번 던지는 실험. - 이항확률변수 : n번의 시행 중 '성공' 횟수를 이항확률변수 $X$로 정의함. 이산형 확률변수. * 이항분포의 확률질량함수 : $f(x) = P(X=x) = \binom{n}{x}p^x(1-p)^{n-x}$ 이런 경우 이항확률변수 $X$는 $Bin(n,p)$로 표기함. $n$과 $p$가 $binomial$..
[ProDS] 3. 확률변수와 확률분포, 분포의 특성치 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. - 확률변수 : 표본공간에서 정의된 실수값 함수. 다시 말하자면, 표본공간의 원소에 실수를 대응시키는 함수, 즉 사건의 결과를 실수로 바꿔놓은 것이라고도 말할 수 있다. $X$로 표현한다. ex) 동전 한번 던지기. $S = {H, T} $. H에 1을, T에 0을 대응시키면 $$ X = \begin{cases}1 & if \quad H\\0 & if \quad T\end{cases} $$ 주사위 2번 던지기. $S = \left\{ (1,\, 1),\, (1,\, 2),\, \cdots \, (6,\, 6) \right\}$. 두 눈의 합을 대응시키면 $ X = \left\{ 2, 3, \cdots 6 \right\} $ 1) 이산형 ..
[ProDS] 2. 베이즈 정리Bayes' theorem 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. - 표본공간 분할 : 원인 $B_1, B_2, \cdots B_k$가 서로 다른 $i$, $j$에 대해 아래의 조건을 모두 만족하는 경우를 말한다. 1) $B_i\cap B_j = \varnothing$ => $(B_i와 B_j는 상호배반)$ 2) $B_1 \cup B_2 \cup \cdots \cup B_k = S$ - 전확률 공식 : k개의 B에 의해 표본공간 S가 분할되어있고, S에서 정의되는 A에 대해 성립하는 확률 공식 $$ P(A) = P(A\cap B_1) + \cdots + P(A\cap B_k) = P(B_1)P(A|B_1)+ \cdots + P(B_k)P(A|B_k) $$ $$ (\because P(A|B_1) = \f..
[ProDS] 1. 확률의 개념과 특징. 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. - 확률의 개념과 특징 통계학statistics : 데이터에 담긴 표면적인 정보를 정확히 요약하고, 담긴 의미를 추론하고 해석하기 위한 학문. 모수parameter : 알고자 하는 미지의 정보. ex) 특정 후보의 지지율, 동물의 평균 수명, 온도, 불량률, etc. 확률probability : 어떤 사건이 발생할 가능성을 0~1 사이의 숫자로 나타낸 것. 확률모형probabilistic model : 확률실험random experiment(시행을 반복할 때마다 나오는 결과가 매번 달라지는 현상or 실험)에 대한 수리적 모형을 뜻한다. 표본공간sample space : 확률실험에서 가능한 모든 사건의 결과의 집합. 보통 S로 나타낸다. ..
[블로그 소개] 경빈의 블로그 경빈의 공부 기록을 남기기 위한 블로그입니다. 공부는 비단 학문에만 한정된 것이 아니므로, 다양한 기록을 올릴 예정입니다. 혹여나 우연찮게 이 블로그에 발길이 닿으시는 분들에게 유용한 정보를 기록할 수 있길 바랍니다. 감사합니다. 모두 행복합시다 :)