엑셀 표준편차 의미 - egsel pyojunpyeoncha uimi

표준편차란 산포도의 일종으로, 주어진 자료들이 평균에서 얼마나 흩어지는 경향성을 보이는지 판단하는 지표다.

다음과 같은 자료가 있다면 평균은 80, 표준편차는 5가 된다.

엑셀 표준편차 의미 - egsel pyojunpyeoncha uimi

여기서 표준편차가 5라는 것은 자료 중 절반은 평균보다 5가 크고, 나머지 절반은 평균보다 5가 작다는 의미이다.

STDEV.P 와 STDEV.S 는 모두 표준편차를 구하는 함수인데, 전자는 주어진 자료가 전부일 때, 후자는 주어진 자료가 일부일 때 사용한다.

[이미지: 위키피디아]

위 그림에서 위쪽, 1번부터 12번까지가 우리가 알고 싶은 '전체' 라고 할 때, 이것을 모집단Population 이라고 한다.

현실에서는 모집단 전체의 자료를 모으는 것이 거의 불가능하므로 일부 자료를 모아 그 자료를 토대로 모집단의 특성을 추측한다.

위 그림에서 2, 5, 8, 11번은 그렇게 모은 일부의 자료를 의미하며, 이것을 표본집단Sample 이라고 한다. 

STDEV 뒤에 붙는 PS 는 각각 모집단과 표본집단을 의미한다. (STDEV 는 표준편차Standard Deviation의 약자이다.)

우리가 이 함수에 넣고 싶은 자료가 '전체'에 해당한다면 P를, '일부'에 해당한다면 S를 사용하면 되겠다.

위의 엑셀 화면에서는 A1 부터 A10 까지 10개의 자료가 전부이므로 STDEV.P 를 사용하였다.

STDEV.S 를 사용하면 다음과 같은 결과가 나온다.

만일 A1부터 A10까지 10개의 숫자가 자료의 전부가 아니라, 어떤 더 많은 수들의 집합으로부터 임의로 10개만 뽑은 것이라면

그 원래 집합(모집단)의 표준편차는 5.27 로 추정할 수 있다는 것이다.

물론 여기에서 실제 그런 모집단은 존재하지 않으므로 저 수는 허구가 되겠지만, 표본집단으로부터 모집단의 성질을 추측할 수 있는 방법이 

이미 수학적으로 잘 정리되어 이렇게 엑셀 함수로 간단히 이용할 수 있다는 것은 실로 기꺼운 일이라 하겠다.

평균을 변화시키지 않으면서 자료를 살짝 바꾸어보자. 85 하나를 100으로, 75 하나를 60으로 바꾸어도 평균은 80일 것이다. 

표준편차는 커질텐데, 얼마나 커질까?

엑셀은 표준편차가 10이라고 알려준다.

이는 마치 80을 평균으로 절반의 자료는 90, 나머지 절반의 자료는 70인 것과 비슷한 분포를 보인다고 얘기하는 것이다.

그러니까 이것과 -

이것이 -

서로 비슷한 분포라고 말하고 있는 것이다.

실제로 이 둘이 비슷한지, 비슷하다면 어떤 점에서 비슷한지 판단하는 것은 사용자의 몫일 것이나 

표준편차는 우리에게 분포를 단적으로 이해할 수 있는 유용한 값을 제공해 준다.

표준편차는 데이터들이 평균값에서 얼마나 떨어져서 분포하는지를 나타냅니다.

만약 표준편차가 0이라면 모든 데이터들이 평균값과 동일하단 뜻이 됩니다.

엑셀로 표준편차를 구하는 방법은 직접 수식을 세워서 구하는 방법과 미리 정의된 함수(STDEV 계열)를 사용하는 방법이 있습니다.

물론 실수를 줄이기 위해서 미리 마련된 함수를 사용하는 것이 좋겠죠.

엑셀 표준편차 구하기

STDEV, STDEV.S

표본에서 표준편차(표본표준편차)를 구하는 함수

STDEVP, STDEV.P

모집단의 표준편차(모표준편차)를 구하는 함수

STDEV는 Standard Deviation의 약자로 표준편차라는 뜻이다.

STDEV.S 에서 마지막 S는 Sample의 약자로 표본에서 표준편차를 구한다는 뜻이다. 여기서 표본은 조사 대상이 되는 데이터에서 부분적으로 추출한 데이터들를 의미한다.

STDEV.P 에서 마지막 P는 Population의 약자로 모집단에서 표준편차를 구한다는 뜻이다. 여기서 모집단은 조사 대상이 되는 데이터 전체를 의미한다.


표본 : 조사 대상이 되는 데이터에서 부분적으로 추출한 데이터들

모집단 : 조사 대상이 되는 데이터 전체

STDEV.S와 STDEV.P 함수는 엑셀 2010버전부터 생긴 함수입니다. 기존 함수(STDEV, STDEVP)는 이전 버전 엑셀과 호환성을 위해서 존재합니다.

예제) 다음은 1학년부터 3학년까지 학년별로 10명씩 키를 재어 기록한 표입니다. 그리고 이 표의 데이터를 가지고 표준편차를 구했습니다.

엑셀 표준편차 의미 - egsel pyojunpyeoncha uimi

이 표를 모집단으로 하여 구한 표준편차는 9.312823632입니다. (STDEV.P함수)

이 표를 표본으로 하여 표준편차를 구한 것이 9.472039919입니다. (STDEV.S 함수)


위 예제에서 두 함수(STDEV.P, STDEV.S)에 동일한 셀범위가 전달되었습니다. 하지만 STDEV.P에 전달된 데이터 범위는 모집단으로 간주되고 STDEV.S에 전달된 데이터 범위는 표본으로 간주됩니다.

그리고 이 두 함수의 원래의 수식은 다음과 같습니다.

STDEV.P 함수의 원래 수식에서 x는 모집단의 평균(모평균), n은 모집단의 크기를 나타냅니다.

STDEV.S 함수의 원래 수식에서 x는 표본의 평균(표본평균), n은 표본의 크기를 나타냅니다.

그림을 보면 모표준편차와 표본표준편차를 구하는 공식이 다르기 때문에(분모가 각각 n, n-1로 다름) 두 함수에 전달된 데이터범위가 같더라도 결과는 다르게 나오는 것입니다.