질환군과 비질환군을 따로 모집한 경우?
-
게시물 수정 , 삭제는 로그인 필요
10개 병원에 내원한 환자들에게 T라는 검사를 시행하였고, 이 검사와는 별개의 기준으로 A라는 질환의 여부를 진단했습니다.
검사 T의 하위 소검사들(t1~t7)부터 도출되는 24가지 결과값(r1~r24)을 바탕으로 요인분석을 시행하여 잠재요인들을 도출한 뒤, 이 잠재요인들이 질환 A의 유무를 예측할 수 있는가를 로지스틱 회귀분석으로 확인하고자 합니다.
그런데 데이터를 검토하던 중, 비질환군(A로 진단되지 않음) 데이터 중 일부가 실제로는 질환군인데 잘못 코딩된 것을 알게 되었습니다.
문제는 어떤 데이터가 잘못 코딩된 데이터인지 확인할 방법이 없다는 것입니다.
그래서 이 데이터에서는 A로 진단된 환자들의 데이터만 추리고, 별개의 연구를 위해 모집했던 정상군의 데이터를 합쳐 이것을 바탕으로 로지스틱 회귀분석을 진행하려고 합니다.
이렇게 통계분석을 진행하게 될 경우 통계적 오류 발생 가능성은 없는지 궁금합니다.
검사 T의 하위 소검사들(t1~t7)부터 도출되는 24가지 결과값(r1~r24)을 바탕으로 요인분석을 시행하여 잠재요인들을 도출한 뒤, 이 잠재요인들이 질환 A의 유무를 예측할 수 있는가를 로지스틱 회귀분석으로 확인하고자 합니다.
그런데 데이터를 검토하던 중, 비질환군(A로 진단되지 않음) 데이터 중 일부가 실제로는 질환군인데 잘못 코딩된 것을 알게 되었습니다.
문제는 어떤 데이터가 잘못 코딩된 데이터인지 확인할 방법이 없다는 것입니다.
그래서 이 데이터에서는 A로 진단된 환자들의 데이터만 추리고, 별개의 연구를 위해 모집했던 정상군의 데이터를 합쳐 이것을 바탕으로 로지스틱 회귀분석을 진행하려고 합니다.
이렇게 통계분석을 진행하게 될 경우 통계적 오류 발생 가능성은 없는지 궁금합니다.