본문 바로가기

STUDY/확률과 통계

[ProDS] 14. 모평균 비교에 관한 가설검정(independent two sample t-test)

본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다.

두 모집단의 모평균의 차이($\mu_1 - \mu_2$)

- 두 모집단 $X,\, Y$는 아래 조건들을 만족한다.

1) 서로 독립이고

2) 등분산이며

3) 정규 모집단이다

$$X\sim N[\mu_1,\, {\sigma_1}^2],\quad Y\sim N[\mu_2,\, {\sigma_2}^2],\quad {\sigma_1}^2 = {\sigma_2}^2 = \sigma^2$$

이 때, $\theta = \mu_1- \mu_2$에 관한 추론은 추정량 $\hat{\theta}=\bar{X_1}- \bar{X_2}$의 표본분포를 이용한다.

$\bar{X_1}$ : 모집단 $X$의 표본평균,   $\bar{X_2}$ : 모집단 $Y$의 표본평균

 

추정량($\hat{\theta}=\bar{X_1}- \bar{X_2}$)의 표본분포

1) $$\bar{X_1}-\bar{X_2} = \hat{\theta} \sim N[\mu_1- \mu_2,\, \sigma^2(\frac{1}{n_1}+\frac{1}{n_2})]$$

2) $$Z = \frac{\bar{X_1}-\bar{X_2}-(\mu_1- \mu_2)}{\sqrt{\sigma^2(\frac{1}{n_1}+\frac{1}{n_2})}} \sim N[0,\, 1] \quad (Normalization)$$

3) $\sigma^2$를 모를 때는

$$T = \frac{\bar{X_1}-\bar{X_2}-(\mu_1- \mu_2)}{\sqrt{{S_p}^2(\frac{1}{n_1}+\frac{1}{n_2})}} \sim t[n_1+n_2 - 2]$$

 * 여기서 ${S_1}^2,\, {S_2}^2$는 각각 모집단 $X,\, Y$의 표본분산이며, ${S_p}^2$는 ${S_{pooled}}^2$, 합동분산추정량$Pooled\, sample\, variance$d이다. 

$${S_p}^2 = \frac{(n_1 -1){S_1}^2+(n_2 -1){S_2}^2}{n_1 + n_2 - 2}$$

 

모평균 비교에 관한 독립 이표본 t검정$independent\, two\, sample\, t-test$

- 가설 유형(등분산임을 가정한다) : 관심 모수가 $\mu_1 - \mu_2$, 검정하고자 하는 모수의 경계값은 0

  1) 왼꼬리 검정 - $H_0 : \mu_1 - \mu_2 = 0,\; H_1 : \mu_1 - \mu_2 < 0$

  2) 오른꼬리 검정 - $H_0 : \mu_1 - \mu_2 = 0,\; H_1 : \mu_1 - \mu_2 > 0$

  3) 양측 검정 - $H_0 : \mu_1 - \mu_2 = 0,\; H_1 : \mu_1 - \mu_2 \neq 0$

 

- 검정 통계량

: 검정통계량 $T$는 $H_0 : \mu_1 - \mu_2 = 0$이 사실일 때, $T = \frac{\bar{X_1}-\bar{X_2}}{\sqrt{{S_p}^2(\frac{1}{n_1}+\frac{1}{n_2})}} \sim t[n_1+n_2 - 2]$ 를 만족한다.

 

- $p-value$

: $H_0$가 사실일 때 검정통계량 $T$의 분포에서 $t_0$(=표본으로부터 계산된 검정통계량)보다 $H_1$쪽으로 더 극단적인 값이 나올 확률

 

- 유의수준 $100\alpha$% 검정법

 : $p-value \leq \alpha \quad \Rightarrow \quad H_0$기각, $H_1$채택