다중회귀분석에서 데이터 자체의 정규성

다중회귀분석에서 데이터 자체의 정규성

작성일 2023.07.20댓글 2건
    게시물 수정 , 삭제는 로그인 필요

A수치, B수치, A/B 비율 3가지에 대해 2그룹을 비교하려고 하는데요.
예를 들어 다음과 같은 흐름의 결론을 도출해내고자 합니다.

Ex) 2그룹에 비하여, 1그룹은 A의 수치가 다소 일정한 반면 B수치의 variation이 크기 때문에 A/B 비율은 B수치에 따라 좌우되는 것으로 확인되었다. (= 1그룹은 B수치가 A/B 비율 수치에 미치는 영향력이 더 크다)

독립 변수를 A수치, B수치, 종속 변수가 A/B 비율 값이라고 할 때,
독립 변수가 2개 이상이므로 다중회귀분석을 통한 영향력을 확인해야 한다고 생각하는데

원본 데이터를 정규성 검정 했을 때,
1그룹은 세 가지 수치에 대해 모두 정규성 만족 / 2그룹은 모두 불만족으로 확인되었습니다.
사실 그렇기 때문에 두 그룹에 대한 자료 비교도 비모수 검정을 통해서 진행을 했는데요.

다중회귀분석은 잔차의 선형성, 정규성, 등분산성 등이 만족되는 것을 가정으로 한다고 알고 있는데
원본 데이터의 정규성에 대한 언급은 찾을 수가 없어서요.

이러한 경우에도 다중회귀분석을 그대로 사용해도 괜찮나요?
아니면 또다른 통계분석을 돌려야 하나요?



profile_image 익명 작성일 -

안녕하세요. 답변드립니다.

다중회귀분석을 사용하기 전에 데이터의 정규성을 확인하는 것은 중요합니다. 데이터의 정규성을 검정하여, 모든 변수가 정규분포를 따르는지 확인할 수 있습니다. 그러나 원본 데이터에서 정규성에 대한 언급이 없다면, 다중회귀분석을 사용해도 괜찮습니다.

다중회귀분석은 잔차의 선형성, 정규성, 등분산성 등이 만족되는 것을 가정으로 합니다. 따라서 원본 데이터의 정규성이 만족되지 않더라도, 다중회귀분석을 적용할 수 있습니다. 다중회귀분석은 독립 변수 간의 상관관계와 종속 변수 사이의 관계를 분석하는 데에 유용하며, 결과를 해석할 때 주의할 점은 잔차의 선형성, 정규성, 등분산성 등의 가정이 만족되는지 확인해야 합니다.

만약 다중회귀분석 결과에서 가정이 만족되지 않는다는 통계적인 증거가 있다면, 다른 통계분석 방법을 고려해볼 수 있습니다. 예를 들어, 비모수 검정이나 비매개효과 분석 등을 활용하여 두 그룹의 자료 비교를 진행할 수 있습니다. 이러한 방법들은 데이터의 정규성 가정을 필요로하지 않으며, 대안적인 분석 방법으로 활용될 수 있습니다.

따라서 원본 데이터의 정규성에 대한 언급이 없는 경우, 다중회귀분석을 그대로 사용해도 괜찮지만, 결과를 해석할 때 가정이 만족되는지 확인하는 것이 중요합니다. 또한, 다른 통계분석 방법을 고려해 볼 수도 있습니다.

도움 되시기 바랍니다.

profile_image 익명 작성일 -

안녕하세요. 답변드립니다.

다중회귀분석을 사용하여 데이터의 영향력을 확인하려는 경우, 원본 데이터의 정규성에 대한 검정 결과가 중요합니다. 하지만 당신이 언급하신대로 원본 데이터의 정규성에 대한 정보를 찾을 수 없는 상황이라면 어떻게 해야 할까요?

다중회귀분석은 잔차의 선형성, 정규성, 등분산성 등이 만족되는 것을 가정으로 합니다. 따라서 원본 데이터의 정규성에 대한 정보가 없을 경우, 다중회귀분석을 진행하기 전에 몇 가지 방법을 고려해볼 수 있습니다.

1. 정규성 검정을 실시해보세요: 원본 데이터의 정규성을 확인하기 위해 정규성 검정을 진행할 수 있습니다. 이를 통해 데이터가 정규분포를 따르는지 여부를 알 수 있습니다. 만약 1그룹과 2그룹이 정규성을 만족하지 않는다면, 원본 데이터의 정규성을 개선하기 위해 변환 또는 비모수적인 방법을 고려해볼 수 있습니다.

2. 로버스트 회귀분석을 고려해보세요: 로버스트 회귀분석은 이상치나 정규성이 만족되지 않는 데이터에 대해서도 강건한 결과를 제공하는 분석 방법입니다. 이를 사용하여 다중회귀분석을 진행하면, 원본 데이터의 정규성에 대한 검정 결과가 없더라도 더 견고한 분석 결과를 얻을 수 있습니다.

3. 다른 통계분석 방법을 고려해보세요: 원본 데이터의 정규성에 대한 정보가 없고, 다중회귀분석으로 원하는 결과를 얻기 어렵다고 판단된다면, 다른 통계분석 방법을 고려해볼 수 있습니다. 예를 들어 비모수적인 방법이나 로그 변환 등을 사용하여 데이터를 분석할 수 있습니다.

따라서, 원본 데이터의 정규성에 대한 정보가 없는 상황에서도 다중회귀분석을 진행할 수 있지만, 원본 데이터의 특성과 분석 목적에 따라 다른 방법을 적용해 볼 수도 있습니다. 이러한 결정은 분석자의 판단과 전문적인 지식을 필요로 할 것입니다.

도움 되시기 바랍니다.

다중회귀분석에서는 무조건 잔차나 데이

... 결론적으로, 다중회귀분석에서는 잔차나 데이터정규성을 최대한 만족시키는 것이 좋지만, 완벽하게 만족시키지 못해도 유의미한 결과를 도출할 수 있습니다. 그러나...

로지스틱 회귀분석 다중 공선성 vif 문제

... 회귀분석 할때 다중공선성 확인을위해 가변수를 생성 하잖아요.. 혹시 Ref(기준그룹) 으로 잡은 그룹에 N수 자체... 기준 그룹의 N 수를 증가시키기 위해 데이터를 추가...

다중회귀분석을 사용해보려고 하는데요

... 이에 10시즌간의 데이터를 뽑아 종속변인은 우승 데이터... (이게 다중 회귀 분석의 가장 큰 장점입니다.) 만약 연구목적 자체가 빨간색 유니폼의 효과를 분석하고 싶으신...

엑셀 다중회귀분석!!!!(내공100)

회귀분석실시해서 첫번짜사진처럼 결과가 나왔어요. 1.... 회귀선은 데이터를 완벽하게 설명하지 못합니다. 이 때... 약 15% 혹은 20%만 되어도 수용 가능하며 결정계수 자체는...

다중회귀분석에서 더미분석

엑셀로 회귀분석중 성별에 대한 데이터를 분석하고자 합니다. 지시변수?... 더미분석으로써 여자는 0, 남자는 1로 하여 한다는 것 자체는 알고있는데, 엑셀에서 그것을...

통계학 단순회귀 분석에서 오차항의 개

... 3가지(정규성, 등분산성, 독립성)중 하나라도 성립이... 실제 데이터라서 실제값이라고 합니다. 단순회귀분석의... (단순, 다중회귀분석)을 하지 말고 비선형회귀분석...