[ProDS] 14. 모평균 비교에 관한 가설검정(independent two sample t-test)
본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 두 모집단의 모평균의 차이($\mu_1 - \mu_2$) - 두 모집단 $X,\, Y$는 아래 조건들을 만족한다. 1) 서로 독립이고 2) 등분산이며 3) 정규 모집단이다 $$X\sim N[\mu_1,\, {\sigma_1}^2],\quad Y\sim N[\mu_2,\, {\sigma_2}^2],\quad {\sigma_1}^2 = {\sigma_2}^2 = \sigma^2$$ 이 때, $\theta = \mu_1- \mu_2$에 관한 추론은 추정량 $\hat{\theta}=\bar{X_1}- \bar{X_2}$의 표본분포를 이용한다. $\bar{X_1}$ : 모집단 $X$의 표본평균, $\bar{X_2}$ : 모집단 $Y$의 표본평균 ..
[ProDS] 10. 통계적 추론 개요, 표본추출법
본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 모집단의 분포와 확률표본 - 모집단의 변수(확률변수) $X$의 확률분포함수를 $f(x)$로 가정했을 때, $f(x)$로부터의 확률표본 $X_1,\, X_2,\, \cdots ,\, X_n$은 다음의 두 가지 성질을 만족하는 표본을 뜻한다. 1) $X_1,\, X_2,\, \cdots ,\, X_n$은 서로 독립이다. 2) $X_1,\, X_2,\, \cdots ,\, X_n$은 모두 $f(x)$의 분포를 따른다. 통계량과 표본분포 1) 통계량 : 확률표본 $X_1,\, X_2,\, \cdots ,\, X_n$의 함수. ex) 표본평균 $ \bar{X} = \sum_{i=1}^{n} \frac{X_i}{n},\quad E(\bar{X})=..
[ProDS] 9. 수치적 기술통계 - 2) 연관성
본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다. 선형적 연관성 : 두 변수가 비례 혹은 반비례 관계인 경우, 선형적 연관성이 있다고 한다. 1) 선형적 연관성의 방향 2) 선형석 연관성의 강도 선형적 연관성 척도 - 표본 공분산$Sample\; Covariance$ 1) n쌍의 표본자료$(x_1,\, y_1), \cdots , (x_n,\, y_n)$이 주어졌을 때(예시 - 키,몸무게 쌍) $$s_{xy} = \frac{\sum_{i=1}^n(x_i-\bar{x})(y_i-\bar{y})}{n-1}$$ 2) 선형관계의 방향 : $s_{xy}>0\to$양의 선형관계, $s_{xy}0\to$ 양의 상관관계, $r_{xy}\to$ 음의 상관관계 2) 선형관계의 강도 : $\lvert r_{..