본문 바로가기

STUDY

(98)
[ProDS] 10. 통계적 추론 개요, 표본추출법 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 모집단의 분포와 확률표본 - 모집단의 변수(확률변수) $X$의 확률분포함수를 $f(x)$로 가정했을 때, $f(x)$로부터의 확률표본 $X_1,\, X_2,\, \cdots ,\, X_n$은 다음의 두 가지 성질을 만족하는 표본을 뜻한다. 1) $X_1,\, X_2,\, \cdots ,\, X_n$은 서로 독립이다. 2) $X_1,\, X_2,\, \cdots ,\, X_n$은 모두 $f(x)$의 분포를 따른다. 통계량과 표본분포 1) 통계량 : 확률표본 $X_1,\, X_2,\, \cdots ,\, X_n$의 함수. ex) 표본평균 $ \bar{X} = \sum_{i=1}^{n} \frac{X_i}{n},\quad E(\bar{X})=..
[ProDS] 9. 수치적 기술통계 - 2) 연관성 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 선형적 연관성 : 두 변수가 비례 혹은 반비례 관계인 경우, 선형적 연관성이 있다고 한다. 1) 선형적 연관성의 방향 2) 선형석 연관성의 강도 선형적 연관성 척도 - 표본 공분산$Sample\; Covariance$ 1) n쌍의 표본자료$(x_1,\, y_1), \cdots , (x_n,\, y_n)$이 주어졌을 때(예시 - 키,몸무게 쌍) $$s_{xy} = \frac{\sum_{i=1}^n(x_i-\bar{x})(y_i-\bar{y})}{n-1}$$ 2) 선형관계의 방향 : $s_{xy}>0\to$양의 선형관계, $s_{xy}0\to$ 양의 상관관계, $r_{xy}\to$ 음의 상관관계 2) 선형관계의 강도 : $\lvert r_{..
[ProDS] 8. 수치적 기술통계 - 1) 위치, 변이, 모양통계량 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 중심위치척도 1) 평균$Mean$ : 표본자료 $x_1, \cdots , x_n$이 주어졌을 때 표본자료들의 평균은 아래와 같다. $$\bar{x} = \frac{\sum_{i=1}^{n}x_i}{n}$$ 2) 중앙값$Median$ : 표본자료 $x_1, \cdots , x_n$을 오름차순으로 정렬했을 때, 표본자료들의 중앙값은 아래와 같다. $$x_{med} = \begin{cases}(\frac{n+1}{2})_{th}\,x & n\; is\; odd\\Mean\;of\;(\frac{n}{2})_{th}\;x \;and\;(\frac{n}{2}+1)_{th}\;x & n\;is\;even\end{cases}$$ 3) 최빈값$Mode$..
[ProDS] 7. 그래프에 의한 기술통계 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 데이터 시각화 - 질적 자료(명목형, 순서형)인 경우 1) 변수 1개 : Bar chart, Pie chart ... 2) 변수 2개 사이의 연관성 : Heat map, Stacked column chart... - 양적(=숫자형) 자료(이산형 및 연속형) 1) 변수 1개 : Histogram, Box plot, Line chart, QQ plot 2) 변수 2개 사이의 연관성 : Scatter plot
[ProDS] 6. 카이제곱분포, t분포 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 카이제곱분포 1) 정의 : $Z_1,\, Z_2,\, \cdots Z_k$가 $k$개의 서로 독립인 표준정규확률변수라 할 때 $$X={Z_1}^2+{Z_2}^2+\cdots +{Z_k}^2$$ 가 따르는 분포를 자유도가 k인 카이제곱분포라 정의하며 확률분포함수는 $$ f(x)=\frac{1}{\Gamma(\frac{1}{2})2^{\frac{k}{2}}}x^{\frac{k}{2}-1}e^{-\frac{x}{2}}\quad (0C)=\alpha$를 만족하는 특정 값 $C$를 $(1-\alpha)$분위수라 하고, $t_{\alpha,\, k}$로 표기한다.
[ProDS] 5. 정규분포, 표준 정규분포 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 정규분포$ Normal distribution $ 1) 정의 : 확률변수 $X$가 평균이 $ \mu $, 분산이 $ \sigma ^2 $이고 확률밀도함수 $ f(x) $가 $$f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{\frac{-{(x-\mu)^2}}{2\sigma^2}}\quad (-\infty E(Z) = E(\frac{1}{\sigma}X\, -\frac{\mu}{\sigma}) = \frac{1}{\sigma}E(x)-\, \frac{\mu}{\sigma} = \frac{1}{\sigma}\, -\frac{\mu}{\sigma} = 0$$ $$V(ax+b) = a^2V(x)\, => V(Z) = V(\frac..
[ProDS] 4. 이항분포, 포아송분포, 지수분포 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. - 베르누이 시행 : 매 시행의 결과가 성공 or 실패이며, 성공확률이 $p$로 일정한 시행을 말한다. ex) 동전을 하나 던지는 실험. $ S= \left\{H,\, T \right\} $, $ P(H) =$ 1/2 - 이항분포 : 베르누이 시행을 독립적으로 $n$번 반복할 때의 확률분포. ex) 동전 하나를 세 번 던지는 실험. - 이항확률변수 : n번의 시행 중 '성공' 횟수를 이항확률변수 $X$로 정의함. 이산형 확률변수. * 이항분포의 확률질량함수 : $f(x) = P(X=x) = \binom{n}{x}p^x(1-p)^{n-x}$ 이런 경우 이항확률변수 $X$는 $Bin(n,p)$로 표기함. $n$과 $p$가 $binomial$..
[ProDS] 3. 확률변수와 확률분포, 분포의 특성치 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. - 확률변수 : 표본공간에서 정의된 실수값 함수. 다시 말하자면, 표본공간의 원소에 실수를 대응시키는 함수, 즉 사건의 결과를 실수로 바꿔놓은 것이라고도 말할 수 있다. $X$로 표현한다. ex) 동전 한번 던지기. $S = {H, T} $. H에 1을, T에 0을 대응시키면 $$ X = \begin{cases}1 & if \quad H\\0 & if \quad T\end{cases} $$ 주사위 2번 던지기. $S = \left\{ (1,\, 1),\, (1,\, 2),\, \cdots \, (6,\, 6) \right\}$. 두 눈의 합을 대응시키면 $ X = \left\{ 2, 3, \cdots 6 \right\} $ 1) 이산형 ..