Processing math: 76%
본문 바로가기

STUDY

(98)
[ProDS] 10. 통계적 추론 개요, 표본추출법 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 모집단의 분포와 확률표본 - 모집단의 변수(확률변수) X의 확률분포함수를 f(x)로 가정했을 때, f(x)로부터의 확률표본 X1,X2,,Xn은 다음의 두 가지 성질을 만족하는 표본을 뜻한다. 1) X1,X2,,Xn은 서로 독립이다. 2) X1,X2,,Xn은 모두 f(x)의 분포를 따른다. 통계량과 표본분포 1) 통계량 : 확률표본 X1,X2,,Xn의 함수. ex) 표본평균 $ \bar{X} = \sum_{i=1}^{n} \frac{X_i}{n},\quad E(\bar{X})=..
[ProDS] 9. 수치적 기술통계 - 2) 연관성 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 선형적 연관성 : 두 변수가 비례 혹은 반비례 관계인 경우, 선형적 연관성이 있다고 한다. 1) 선형적 연관성의 방향 2) 선형석 연관성의 강도 선형적 연관성 척도 - 표본 공분산SampleCovariance 1) n쌍의 표본자료(x1,y1),,(xn,yn)이 주어졌을 때(예시 - 키,몸무게 쌍) sxy=ni=1(xiˉx)(yiˉy)n1 2) 선형관계의 방향 : sxy>0양의 선형관계, sxy0 양의 상관관계, rxy 음의 상관관계 2) 선형관계의 강도 : $\lvert r_{..
[ProDS] 8. 수치적 기술통계 - 1) 위치, 변이, 모양통계량 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 중심위치척도 1) 평균Mean : 표본자료 x1,,xn이 주어졌을 때 표본자료들의 평균은 아래와 같다. ˉx=ni=1xin 2) 중앙값Median : 표본자료 x1,,xn을 오름차순으로 정렬했을 때, 표본자료들의 중앙값은 아래와 같다. xmed={(n+12)thxnisoddMeanof(n2)thxand(n2+1)thxniseven 3) 최빈값Mode..
[ProDS] 7. 그래프에 의한 기술통계 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 데이터 시각화 - 질적 자료(명목형, 순서형)인 경우 1) 변수 1개 : Bar chart, Pie chart ... 2) 변수 2개 사이의 연관성 : Heat map, Stacked column chart... - 양적(=숫자형) 자료(이산형 및 연속형) 1) 변수 1개 : Histogram, Box plot, Line chart, QQ plot 2) 변수 2개 사이의 연관성 : Scatter plot
[ProDS] 6. 카이제곱분포, t분포 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 카이제곱분포 1) 정의 : Z1,Z2,Zkk개의 서로 독립인 표준정규확률변수라 할 때 X=Z12+Z22++Zk2 가 따르는 분포를 자유도가 k인 카이제곱분포라 정의하며 확률분포함수는 $$ f(x)=\frac{1}{\Gamma(\frac{1}{2})2^{\frac{k}{2}}}x^{\frac{k}{2}-1}e^{-\frac{x}{2}}\quad (0C)=\alpha$를 만족하는 특정 값 $C$를 $(1-\alpha)$분위수라 하고, $t_{\alpha,\, k}$로 표기한다.
[ProDS] 5. 정규분포, 표준 정규분포 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 정규분포Normaldistribution 1) 정의 : 확률변수 X가 평균이 μ, 분산이 σ2이고 확률밀도함수 f(x)f(x)=12πσe(xμ)22σ2(E(Z)=E(1σXμσ)=1σE(x)μσ=1σμσ=0 $$V(ax+b) = a^2V(x)\, => V(Z) = V(\frac..
[ProDS] 4. 이항분포, 포아송분포, 지수분포 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. - 베르누이 시행 : 매 시행의 결과가 성공 or 실패이며, 성공확률이 p로 일정한 시행을 말한다. ex) 동전을 하나 던지는 실험. S={H,T}, P(H)= 1/2 - 이항분포 : 베르누이 시행을 독립적으로 n번 반복할 때의 확률분포. ex) 동전 하나를 세 번 던지는 실험. - 이항확률변수 : n번의 시행 중 '성공' 횟수를 이항확률변수 X로 정의함. 이산형 확률변수. * 이항분포의 확률질량함수 : f(x) = P(X=x) = \binom{n}{x}p^x(1-p)^{n-x} 이런 경우 이항확률변수 XBin(n,p)로 표기함. npbinomial..
[ProDS] 3. 확률변수와 확률분포, 분포의 특성치 본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. - 확률변수 : 표본공간에서 정의된 실수값 함수. 다시 말하자면, 표본공간의 원소에 실수를 대응시키는 함수, 즉 사건의 결과를 실수로 바꿔놓은 것이라고도 말할 수 있다. X로 표현한다. ex) 동전 한번 던지기. S = {H, T} . H에 1을, T에 0을 대응시키면 X = \begin{cases}1 & if \quad H\\0 & if \quad T\end{cases} 주사위 2번 던지기. S = \left\{ (1,\, 1),\, (1,\, 2),\, \cdots \, (6,\, 6) \right\}. 두 눈의 합을 대응시키면 X = \left\{ 2, 3, \cdots 6 \right\} 1) 이산형 ..