표준편차
[ standard deviation , 標準偏差 ]
- 요약
자료의 값이 얼마나 흩어져 분포되어 있는지 나타내는 산포도 값의 한 종류.
표준편차는 자료의 값이 평균으로부터 얼마나 떨어져 있는지, 즉 흩어져 있는지를 나타내는 값이다. 자료의 값들의 평균을 알아도 얼마나 흩어져 분포되어 있는지에 따라 자료의 특징은 완전히 달라진다. 아래의 학생 A와 B의 과목별 성적 평균은 70점으로 동일하지만, 각 과목별 성적의 분포는 완전히 다르다.
학생 A의 과목별 성적표
학생 B의 과목별 성적표
A학생은 모든 과목이 평균 70점에 아주 가까이 분포하지만 B학생은 국어,수학 성적이 평균과 20점이나 떨어져있다. 이 경우 A보다 B의 표준편차가 더 크다.
표준편차를 구하는 방법
표준편차를 구하려면 먼저 각 자료값과 평균의 차이를 구하는데, 이를 '편차'라 한다. 편차는 (자료값)-(평균)이다. 편차를 구하여 그 평균값을 표준편차라 하면 편리하겠지만, 편차의 합은 항상 0이기 때문에 불가능하다. 왜냐하면 평균 자체가 모든 자료값들의 평균값이기 때문이다.
편차의 합이 0이 되는 문제는 편차의 값 중 음수가 발생하기 때문인데, 편차는 음수이든 양수이든 자료가 평균으로부터 얼마나 차이가 나는지 그 절대값을 알고자 구하는 값이므로 편차가 음수가 되지 않도록 제곱하여 모두 양수가 되게 한다. 그리고 편차를 제곱한 값들의 평균을 내면 자료값들이 평균으로부터 어느 정도 떨어져있는지를 알 수 있다. 그러나 아래 B학생의 경우를 보면 편차를 제곱하는 바람에 자료값의 분산도가 266.67(=(400+400)/3)로 너무 커진 것을 확인할 수 있다.
학생 B의 과목별 성적표
제곱해서 과도하게 부풀려진 값을 다시 원래의 차이값이 비슷하게 맞춰주기 위해서는 제곱근을 적용한다. 학생 B의 경우에는 이 표준편차가 된다.
제곱근을 적용하기 직전, (편차)2의 평균을 ‘분산’이라 하고, 표준편차는 이 된다. 다시 말해, 표준편차는 편차 제곱의 평균으로 구할 수 있다. 표준편차가 0일 때는 자료값이 모두 같은 값을 가지고, 표준편차가 클수록 자료값 중에 평균에서 떨어진 값이 많이 존재한다.