본문 바로가기

STUDY/확률과 통계

[ProDS] 11. 점추정과 구간추정

본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다.

추정$Estimation$

: 어떤 모집단의 모수를, 통계량의 값을 이용해서 맞추는 것을 말한다.

 - 추정량 : 모수 $\theta$의 추정에 사용되는 통계량을 $\theta$의 추정량이라 하고, $\hat{\theta}$로 표기한다.

 - 추정치 : 관찰된 표본자료로 추정량의 값을 계산하는 것.

 - 점추정$point\, estimation$ : 하나의 모수를 한 개의 값으로 추정하는 것.

 - 구간추정$interval\, estimation$ : 모수가 포함되어있을 것으로 예상되는 구간으로 모수를 추정하는 것.

 

 

신뢰구간$Confidence\, Interval$

: $\theta$의 추정량 $\hat{\theta}$을 변형한 $L$과 $U$가 $P(L\leq \theta \leq U) = 1\, -\, \alpha \quad (0\leq \alpha \leq 1)$을 만족하는 경우, 구간 $(L,\, U)$를 $\theta$의 $100(1-\alpha)$% (=> 신뢰수준) 신뢰구간이라 한다.

  즉, 신뢰구간은 $\hat{\theta}$과 $\hat{\theta}$의 표본분포를 알아야 구할 수 있다.

 

 

모평균 $\mu$에 대한 신뢰구간(신뢰수준 1-$\alpha$)

 - 모수($\theta$) : 모평균($\mu$)   =>   추정량($\hat{\theta}$) : 표본평균($\bar{X}$)

 

 - 추정량의 표본분포 : $X_1,\, \cdots,\, X_n$이 모분산($\sigma^2$)이 알려진 정규 모집단 $N[\mu,\, \sigma^2]$의 확률분포인 경우 $$\bar{X} \sim N[ \mu,\, \frac{\sigma^2}{n}] $$

$$\rightarrow Normalization \rightarrow  $$

$$ Z = \frac{\bar{X}-\mu}{\sigma/ \sqrt{n}} \sim N[0,\, 1]$$

- 신뢰수준$CI(Confident\, Level)$ :  동일한 구간추정법을 반복적으로 사용할 때 얻어지는 신뢰구간 내에 참값 $\theta$가 있을 확률. 즉, 전체 신뢰구간 중 참값 $\theta$가 포함된 신뢰구간의 비율.

조금 더 쉽게 말하면, 예를 들어 신뢰수준이 95%는 20번의 조사 중 1번은 구간 내에 참값이 없는 결과가 나온다는 것. 

* n개의 표본으로 구한 하나의 신뢰구간에 모수가 있는지 아닌지는 알 수 없음.

 

- 모평균$\mu$에 대한 신뢰구간(신뢰수준 1-$\alpha$)

  : 모평균 $\mu$에 관한 신뢰구간은 아래와 같은 방법으로 구할 수 있다.

$$ 1) \quad P(-Z_\frac{\alpha}{2}\leq Z\leq Z_\frac{\alpha}{2}) = 1 - \alpha $$

$$ 2) \quad P(-Z_\frac{\alpha}{2}\leq \frac{\bar{X}-\mu}{\sigma/ \sqrt{n}} \leq Z_{\frac{\alpha}{2}}) = 1 - \alpha \quad (\because Z = \frac{\bar{X}-\mu}{\sigma/ \sqrt{n}})$$

$$ 3) \quad P(\bar{X}-Z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{X}+Z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}) = 1 - \alpha$$

$$\therefore Length\, of\, CI\, (L,\, U)\, : U-L = 2Z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}} $$

출처 : https://warm-uk.tistory.com/24