표준편차

표준편차

[ standard deviation , 標準偏差 ]

요약 자료의 값이 얼마나 흩어져 분포되어 있는지 나타내는 산포도 값의 한 종류.

표준편차는 자료의 값이 평균으로부터 얼마나 떨어져 있는지, 즉 흩어져 있는지를 나타내는 값이다. 자료의 값들의 평균을 알아도 얼마나 흩어져 분포되어 있는지에 따라 자료의 특징은 완전히 달라진다. 아래의 학생 A와 B의 과목별 성적 평균은 70점으로 동일하지만, 각 과목별 성적의 분포는 완전히 다르다.

학생 A의 과목별 성적표
표준편차 본문 이미지 1

학생 B의 과목별 성적표

표준편차 본문 이미지 2

A학생은 모든 과목이 평균 70점에 아주 가까이 분포하지만 B학생은 국어,수학 성적이 평균과 20점이나 떨어져있다. 이 경우 A보다 B의 표준편차가 더 크다.

표준편차 본문 이미지 3

표준편차를 구하는 방법

표준편차를 구하려면 먼저 각 자료값과 평균의 차이를 구하는데, 이를 '편차'라 한다. 편차는 (자료값)-(평균)이다. 편차를 구하여 그 평균값을 표준편차라 하면 편리하겠지만, 편차의 합은 항상 0이기 때문에 불가능하다. 왜냐하면 평균 자체가 모든 자료값들의 평균값이기 때문이다.

표준편차 본문 이미지 4

편차의 합이 0이 되는 문제는 편차의 값 중 음수가 발생하기 때문인데, 편차는 음수이든 양수이든 자료가 평균으로부터 얼마나 차이가 나는지 그 절대값을 알고자 구하는 값이므로 편차가 음수가 되지 않도록 제곱하여 모두 양수가 되게 한다. 그리고 편차를 제곱한 값들의 평균을 내면 자료값들이 평균으로부터 어느 정도 떨어져있는지를 알 수 있다. 그러나 아래 B학생의 경우를 보면 편차를 제곱하는 바람에 자료값의 분산도가 266.67(=(400+400)/3)로 너무 커진 것을 확인할 수 있다.

학생 B의 과목별 성적표
표준편차 본문 이미지 5

제곱해서 과도하게 부풀려진 값을 다시 원래의 차이값이 비슷하게 맞춰주기 위해서는 제곱근을 적용한다. 학생 B의 경우에는 표준편차 본문 이미지 6이 표준편차가 된다.

제곱근을 적용하기 직전, (편차)2의 평균을 ‘분산’이라 하고, 표준편차는 표준편차 본문 이미지 7이 된다. 다시 말해, 표준편차는 편차 제곱의 평균으로 구할 수 있다. 표준편차가 0일 때는 자료값이 모두 같은 값을 가지고, 표준편차가 클수록 자료값 중에 평균에서 떨어진 값이 많이 존재한다.

역참조항목

비대칭도, 평균편차

카테고리

  • > > >
  • > >
  • > > >