본문 바로가기

STUDY/확률과 통계

[ProDS] 8. 수치적 기술통계 - 1) 위치, 변이, 모양통계량

본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다.

중심위치척도

1) 평균$Mean$

  : 표본자료 $x_1, \cdots , x_n$이 주어졌을 때 표본자료들의 평균은 아래와 같다. $$\bar{x} = \frac{\sum_{i=1}^{n}x_i}{n}$$

2) 중앙값$Median$

  : 표본자료 $x_1, \cdots , x_n$을 오름차순으로 정렬했을 때, 표본자료들의 중앙값은 아래와 같다. $$x_{med} = \begin{cases}(\frac{n+1}{2})_{th}\,x  & n\; is\; odd\\Mean\;of\;(\frac{n}{2})_{th}\;x \;and\;(\frac{n}{2}+1)_{th}\;x & n\;is\;even\end{cases}$$

3) 최빈값$Mode$

  : 가장 빈도가 높은 값, 혹은 구간.

출처 : https://www.biologyforlife.com/skew.html

 

상대적 위치 척도

1) 사분위수$Quartile$

  : $Q_1(=x_{\frac{n+1}{4}})\to 25_{th}\; percentile$, 1사분위수

    $Q_2(=x_{\frac{n+1}{2}})\to median,\; 50_{th}\; percentile$, 2사분위수

    $Q_3(=x_{\frac{3(n+1)}{4}})\to 75_{th}\; percentile$, 3사분위수

* $IQR = Q_3\; -\; Q_1 = 50%$

 

ex) 24, 25, 26, 27, 30, 32, 40, 44, 50, 52, 55, 57 에서  $Q_1(=26.25), \; Q_2(=36), \; Q_3(=51.5)$

 

 

변동성 척도

1) 범위$Range$

  : 표본자료 $x_1,\cdots , x_n$이 주어졌을 때 max(x_i)-\; min(x_i)$ 

2) 사분위간 범위$IQR(Inter\; Quartile\; Range)$ : $Q_3 - Q_1$

3) 표본분산$Sample\; Variance$

  : 표본자료 $x_1,\cdots , x_n$이 주어졌을 때의 표본분산은 아래와 같다. $$s^2 = \frac{\sum_{i=1}^n (x_i- \bar{x})^2}{n-1}$$

* 모든 값이 $a$배가 되면 표본분산은 $a^2$배가 된다.

 

4) 표본 표준편차$Sample\; Standard\; Deviation$

$$s = \sqrt{s^2}$$

5) 변동계수$Coefficient\; of\; Variation$

$$cv = \frac{s}{\bar{x}}$$

 

 

형태 척도

1) 왜도$skewness$

  : 분포의 비대칭 정도를 나타나는 척도. 

출처 : https://velog.io/@qsdcfd/%ED%9E%88%EC%8A%A4%ED%86%A0%EA%B7%B8%EB%9E%A8%EA%B3%BC-%EC%99%9C%EB%8F%84-%EC%B2%A8%EB%8F%84

2) 첨도$kurtosis$

  : 분포가 뾰족한 정도를 나타내는 척도.

출처 :https://cceeddcc.tistory.com/44