산포도

산포도

[ degree of scattering , 散布度 ]

요약 자료의 분산 상황을 나타내는 수의 값으로 변량과 분포가 주어졌을 때, 변량이 분포의 중심값에 흩어진 정도를 말한다. 통계학에서 많이 이용된다.

분산도(分散度)라고도 한다. 변량 x와 그 분포 F(x)가 주어졌을 때, 그 분포의 중심적 위치의 측도(測度)를 m이라 할 때 F(x)의, m 주위에서 흩어져 있는 정도를 나타내는 기술적 지표(記述的指標)이다. 크기가 고르지 않은 집단의 특징은 평균 외에 자료의 값이 흩어져 있는 정도를 조사하면 더욱 뚜렷해진다. 산포도가 클수록 그 분포의 흩어진 폭이 넓고, 산포도가 작을수록 분포의 흩어진 폭은 좁다. 평균값

산포도 본문 이미지 1

가 사용될 때 산포는 보통 σ2=E[(x-mA)]2이 지정된다. 이때, σ2을 x의 분산, σ=√σ 2(양수만을 취함)을 x의 표준편차(標準偏差)라고 한다. 또, m으로서 중앙값(median) 즉 F(x)=0.5인 x의 값 mD를 쓸 때는 산포도로서 보통 δ=Ex-mD가 지정된다. 이것을 x의 평균편차라고 한다. mA 주위에 δ를, mD 주위에 δ2을 생각하지 않는 이유는 직관적으로는, σ2은 mA 주위에서, δ는 mD 주위에서 각각 최소인 값을 취하기 때문이라는 외형적 이유에 의하여 설명된다.

그러나 통계학에서 δ보다도 σ2쪽이(m과 함께) 널리 사용되는 이유는 통상적인 분포에 있어서 이것이 파라미터(매개변수)로서 흔히 등장함과 동시에 δ보다는 σ2쪽이 수학적으로 조작하는 데 있어서 편리하다는 사정이 있기 때문이다. 한정된 개개의 측정값에 의거해서 산포도를 계산하는 데는 위의 정의식(定義式)보다도 σ2=E(x2)-[E(x)]2 인 관계식을 이용하는 것이 편리하다.

카테고리

  • > > >
  • > >
  • > > >