[질문]
[1] 표본의 표준편차라는 말과 표본평균의 표준편차라는 말이 헷갈리네요. 이 둘의 차이점은 무엇인가요? 예를 들어주셔도 좋아요^^
[2]. 그리고 통계적추정 공식에서 X - 1.96시그마/루트n <= m <= X + 1.96시그마/루트n 시그마 자리에 모표준편차를 넣어야하는지, 표본표준편차를 넣어야하는지, 표본평균의표준편차를 넣어야하는지 모르겠어요. 이것도 설명해주셨으면 좋겠습니다..
[풀이]
위의 님들이 잘 설명하셨는데, 저는 부가적으로 말씀드리겠습니다.
[1] 다음과 같은 예문을 통하여 표본과 표본평균의 차이플 생각해 보시고 문제를 접하도록 하겠습니다.
간단한 예를 들어보는 것이 좋겠습니다.
모집단이 {3,5,7,9}인 집단이 있다고 합시다.
그러면 모평균은 (3+5+7+9)/4= 6 ...... ①이고,
모분산 (9+25+49+81)/4 - 36 = 5이므로, 모 표준편차는 √5입니다. 그렇지요?......㉠
이 때, 모집단에서 크기가 2인 표본을 복원추출하게 되면 표본의 가지 수는
(3, 3), (3, 5), (3, 7), (3, 9), (5, 3), (5, 5), (5, 7), (5, 9),
(7, 3), (7, 5), (7, 7), (7, 9), (9, 3), (9, 5), (9, 7), (9, 9)의 16가지가 존재합니다. 그렇지요?
그러면 표본 평균이란, 이들 16가지의 표본의 평균 하나하나인, 3, 4, 5, 6, 4, 5, 6, 7, 5, 6, 7, 8, 6, 7, 8, 9를 가리키고, 표본 평균이 취할 수 있는 값은 3, 4, 5, 6, 7, 8, 9의 7개입니다. 이해되시지요? 아시겠지요?
[※ 그런데, 여기서 표본 편차라고 하면, 이들 각각의 (표본의) 편차를 구해야 하므로, 서로 다른 값이 나오게 됩니다. 그렇지요? 더욱이 표본 평균의 편차도 아니고 그냥 표본 편차라고 하면, (3, 3)=0, (3, 5)=-2, (3, 7)=-4, (3, 9)=-6, (5, 3)=2, (5, 5)=0, (5, 7)=-2, (5, 9)=-4, (7, 3)=4, (7, 5)=2, (7, 7)=0, (7, 9)=-2, (9, 3)=6, (9, 5)=4, (9, 7)=2, (9, 9)=0과 같이 나옵니다. 이것을 표본의 편차라고 합니다. ]
그리고 표본평균의 평균이란, 이들 표본 평균 6개의 평균, 즉,
(3×1 + 4×2 + 5×3 + 6×4 + 7×3 + 8×2+9×1)/16
= (3+8+15+24+21+16+9)/16 = 96/16 = 6 ...... ②을 표본평균의 평균이라고 합니다.
아시겠지요?
그런데, 여기서 ①과 ②에서 보시는 것처럼 모평균과 표본 평균의 평균은 같음을 알게 됩니다. 모든 자료에서 이와 같이 모평균과 표본 평균의 평균을 계산하면 항상 같음을 알게 됩니다. 이점을 유의하시기 바랍니다.
여기서 표본평균의 분산을 구해보면,
(3²×1 + 4²×2 + 5²×3 + 6²×4 + 7²×3 + 8²×2+9²×1)/16 -36
= (9+32+75+144+147+128+81)/16 -36
= 616-576)/16 = 40/16 = 5/2 이므로,
표본 평균의 표준편차는 √(5/2 ) = √5/√2 ...... ㉡입니다. 그렇지요?
위의 ㉠과 ㉡을 비교해 보면, 공식
(표본평균의 분산) = (모분산)/(표본의 크기)
(표본평균의 표준편차) = (모표준편차)/√(표본의 크기)
임을 알게 됩니다.
[2]에 나오는 공식은 어떤 확률의 범위 안에서 표본평균을 구하고 모집단의 평균을 추측하는 데 사용하는 공식입니다. 그런데 이 공식의 “시그마 자리에 모표준편차를 넣어야하는지, 표본표준편차를 넣어야하는지, 표본평균의표준편차를 넣어야하”는지를 질문하셨습니다. 이 공식에 대입해야 하는 것은 문제에 따라 다를 수 있습니다.
1) 모집단의 표준편차를 알려준다면 당연히 모 표준편차를 대입해야 합니다. 위의 공식은 일반적으로 모 표준편차가 시그마인 정규분포를 이루는 모집단에서 크기 n 인 임의 표본을 만든 표본 평균의 평균을 알고 모집단의 평균을 구하는 공식이기 때문입니다.
2) 그러나 일반적으로 예를 들면 전국 고등학생의 모집단에서 크기 n 인 임의 표본을 만들고, 그 임의 표본의 평균과 표준편차를 알게 되므로, 이러한 경우에는 모집단의 크기가 충분히 크기 때문에, 표본평균의 표준편차를 모표준편차로 생각하고 공식을 적용해도 좋다고 수학적으로 알려져 있다는 것입니다. (수학 1의 정석 413페이지 참조할 것)
따라서 위의 두 가지 중에 어느 것에 해당하는지를 잘 검토하셔서 대처하시면 좋겠습니다.
도움이 되시기 바랍니다.
열심히공부하셔서 훌륭한 수학도가 되세요.