Processing math: 100%
본문 바로가기

STUDY/확률과 통계

[ProDS] 8. 수치적 기술통계 - 1) 위치, 변이, 모양통계량

본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다.

중심위치척도

1) 평균Mean

  : 표본자료 x1,,xn이 주어졌을 때 표본자료들의 평균은 아래와 같다. x¯=i=1nxin

2) 중앙값Median

  : 표본자료 x1,,xn을 오름차순으로 정렬했을 때, 표본자료들의 중앙값은 아래와 같다. xmed={(n+12)thxnisoddMeanof(n2)thxand(n2+1)thxniseven

3) 최빈값Mode

  : 가장 빈도가 높은 값, 혹은 구간.

출처 : https://www.biologyforlife.com/skew.html

 

상대적 위치 척도

1) 사분위수Quartile

  : Q1(=xn+14)25thpercentile, 1사분위수

    Q2(=xn+12)median,50thpercentile, 2사분위수

    Q3(=x3(n+1)4)75thpercentile, 3사분위수

* IQR=Q3Q1=50

 

ex) 24, 25, 26, 27, 30, 32, 40, 44, 50, 52, 55, 57 에서  Q1(=26.25),Q2(=36),Q3(=51.5)

 

 

변동성 척도

1) 범위Range

  : 표본자료 x1,,xn이 주어졌을 때 max(x_i)-\; min(x_i)$ 

2) 사분위간 범위IQR(InterQuartileRange) : Q3Q1

3) 표본분산SampleVariance

  : 표본자료 x1,,xn이 주어졌을 때의 표본분산은 아래와 같다. s2=i=1n(xix¯)2n1

* 모든 값이 a배가 되면 표본분산은 a2배가 된다.

 

4) 표본 표준편차SampleStandardDeviation

s=s2

5) 변동계수CoefficientofVariation

cv=sx¯

 

 

형태 척도

1) 왜도$skewness$

  : 분포의 비대칭 정도를 나타나는 척도. 

출처 : https://velog.io/@qsdcfd/%ED%9E%88%EC%8A%A4%ED%86%A0%EA%B7%B8%EB%9E%A8%EA%B3%BC-%EC%99%9C%EB%8F%84-%EC%B2%A8%EB%8F%84

2) 첨도$kurtosis$

  : 분포가 뾰족한 정도를 나타내는 척도.

출처 :https://cceeddcc.tistory.com/44