본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다.
두 모집단의 모평균의 차이($\mu_1 - \mu_2$)
- 두 모집단 $X,\, Y$는 아래 조건들을 만족한다.
1) 서로 독립이고
2) 등분산이며
3) 정규 모집단이다
$$X\sim N[\mu_1,\, {\sigma_1}^2],\quad Y\sim N[\mu_2,\, {\sigma_2}^2],\quad {\sigma_1}^2 = {\sigma_2}^2 = \sigma^2$$
이 때, $\theta = \mu_1- \mu_2$에 관한 추론은 추정량 $\hat{\theta}=\bar{X_1}- \bar{X_2}$의 표본분포를 이용한다.
$\bar{X_1}$ : 모집단 $X$의 표본평균, $\bar{X_2}$ : 모집단 $Y$의 표본평균
추정량($\hat{\theta}=\bar{X_1}- \bar{X_2}$)의 표본분포
1) $$\bar{X_1}-\bar{X_2} = \hat{\theta} \sim N[\mu_1- \mu_2,\, \sigma^2(\frac{1}{n_1}+\frac{1}{n_2})]$$
2) $$Z = \frac{\bar{X_1}-\bar{X_2}-(\mu_1- \mu_2)}{\sqrt{\sigma^2(\frac{1}{n_1}+\frac{1}{n_2})}} \sim N[0,\, 1] \quad (Normalization)$$
3) $\sigma^2$를 모를 때는
$$T = \frac{\bar{X_1}-\bar{X_2}-(\mu_1- \mu_2)}{\sqrt{{S_p}^2(\frac{1}{n_1}+\frac{1}{n_2})}} \sim t[n_1+n_2 - 2]$$
* 여기서 ${S_1}^2,\, {S_2}^2$는 각각 모집단 $X,\, Y$의 표본분산이며, ${S_p}^2$는 ${S_{pooled}}^2$, 합동분산추정량$Pooled\, sample\, variance$d이다.
$${S_p}^2 = \frac{(n_1 -1){S_1}^2+(n_2 -1){S_2}^2}{n_1 + n_2 - 2}$$
모평균 비교에 관한 독립 이표본 t검정$independent\, two\, sample\, t-test$
- 가설 유형(등분산임을 가정한다) : 관심 모수가 $\mu_1 - \mu_2$, 검정하고자 하는 모수의 경계값은 0
1) 왼꼬리 검정 - $H_0 : \mu_1 - \mu_2 = 0,\; H_1 : \mu_1 - \mu_2 < 0$
2) 오른꼬리 검정 - $H_0 : \mu_1 - \mu_2 = 0,\; H_1 : \mu_1 - \mu_2 > 0$
3) 양측 검정 - $H_0 : \mu_1 - \mu_2 = 0,\; H_1 : \mu_1 - \mu_2 \neq 0$
- 검정 통계량
: 검정통계량 $T$는 $H_0 : \mu_1 - \mu_2 = 0$이 사실일 때, $T = \frac{\bar{X_1}-\bar{X_2}}{\sqrt{{S_p}^2(\frac{1}{n_1}+\frac{1}{n_2})}} \sim t[n_1+n_2 - 2]$ 를 만족한다.
- $p-value$
: $H_0$가 사실일 때 검정통계량 $T$의 분포에서 $t_0$(=표본으로부터 계산된 검정통계량)보다 $H_1$쪽으로 더 극단적인 값이 나올 확률
- 유의수준 $100\alpha$% 검정법
: $p-value \leq \alpha \quad \Rightarrow \quad H_0$기각, $H_1$채택
'STUDY > 확률과 통계' 카테고리의 다른 글
비즈니스 분석 및 DS를 위한 핵심 통계학_분포 (2) 분포 (0) | 2024.06.14 |
---|---|
비즈니스 분석 및 DS를 위한 핵심 통계학_분포 (1) 연속 vs 불연속 (0) | 2024.06.14 |
[ProDS] 13. 모평균에 관한 가설검정(One sample t-test) (0) | 2023.08.08 |
[ProDS] 12. 가설검정의 원리 (0) | 2023.08.07 |
[ProDS] 11. 점추정과 구간추정 (0) | 2023.08.04 |