PDF 파일을 어떻게 텍스트 인식해서 PDF 원문을 복사 한 후 한글 등...

PDF 파일을 어떻게 텍스트 인식해서 PDF 원문을 복사 한 후 한글 등...

작성일 2014.01.22댓글 1건
    게시물 수정 , 삭제는 로그인 필요

PDF 로 다운로드 받은 문서를 한글 파일 등에 복사해서, 일부 단락은 편집해서 사용하려고 합니다.

 

그런데 PDF ADOBE 나, EZ PDF READER 프로그램으로 PDF 자체를 볼 수는 있어도, 이를 워드 문서를 복사한 후 한글에다 붙여 넣기 할 때 처럼 사용은 못하네요.

 

PDF 파일도 텍스트 형식이 있고, 스캔 형태가 있다고 하는데요, 2 경우 모두 궁금합니다.

 

텍스트형식의 PDF 파일은 어떻게 복사, 붙여 넣기 가능한지...

 

그리고 스캔된 문서의 경우 PDF 파일을 JPG 파일로 변환한 후, NAVER OCR 프로그램으로 돌린다는 이야기 있는데, 가장 편하게 할 수 있는 프로그램은 뭔지, 그리고 더 편리한 방법은 있는지 궁금합니다.

 

PDF 프로그램 돈 주고 사는 정식 버전이 있으면 위 기능들 바로 되겠죠?


#pdf 파일을 한글파일로 변환 #pdf 파일을 엑셀로 변환 #pdf 파일을 워드로 변환 #pdf 파일을 열 수 없습니다 #pdf 파일을 이미지로 변환 #pdf 파일을 jpg로 변환 #pdf 파일을 한글로 변환 #pdf 파일을 ppt로 #pdf 파일을 한글파일로 #pdf 파일을 word 파일로 변환

profile_image 익명 작성일 -

다른 프로그램에서 제작한 파일을 PDF로 변환할 당시

글자를 글자로 살려서 하는 방식이 있고

글자를 하나의 도형처럼 글자를 깨트리는 방식이 있습니다.(아웃라인 혹은 곡선처리)

 

1. 글자가 살아 있게 PDF를 만들면

PDF에서도 글자를 드래그 해서 복사가 가능합니다.

 

그러나 PDF 편집프로그램을 통해 보안을 걸어서

복사방지를 할수도 있습니다.

 

그리고 PDF 변환할때의 프로그램에 따라

한글을 암호화???(혹은 한글코드방식을 다르게 형성) 시키는 프로그램도 있습니다.

이런경우는 PDF 를 만들어서 글자를 복사를 해도

붙혀넣기를 하면 한글이 깨지는(이상한 문자로 변신- 대표적 프로그램:코렐드로우) 프로그램도 있습니다.

 

 

2. 글자를 깨뜨려서 PDF로 변환시키면

PDF에서도 글자 복사가 안됩니다.. 보이기에는 글자인데 글자가 아니기 때문입니다.

 

 

3. 이미지로 된 PDF의 경우(스캔의 경우 포함)

이건 이미지 이기 때문에 글자 복사를 전혀 할수가 없습니다.

그래서

OCR 프로그램을 통해 글자를 추출해 낼수가 있는데

비싼 유료프로그램 부터 무료프로그램까지 있습니다.

 

아르미. 라는 프로그램이 국산 OCR 프로그램으로는 가장 오래된것 같은데

한글, 영어, 한문까지도 가능합니다.

그러나 이런 OCR 프로그램은 제일 먼저 선제조건이

글자체가 반듯해야 하며 글자 크기가 크고  이미지 해상도가 좋아야 글자도 잘 인식됩니다.

무료프로그램일수록 글자 인식율이 떨어질수도 있습니다.

 

Acrobat  PRO 버젼을 설치하면

PDF 파일을 바로 OCR 텍스트 추출이 가능합니다.

한글 글자 인식율은 이미지에 따라 다르지만 70% 정도.. 가능할것 같습니다.

 

 

PDF 파일에서 글자 복사가 안되는 이유는 이렇게 다양합니다.

 

 

------------------
답변에 도움이 되셨다면 답변확정하기. 꼭 눌러주세요.(점수 50% 환급)

인식해서 PDF 원문을 복사 한 후 한글...

... 문서를 복사한 후 한글에다 붙여 넣기 할 때 처럼 사용은 못하네요. PDF 파일텍스트 형식이 있고, 스캔... 텍스트형식의 PDF 파일어떻게 복사, 붙여 넣기 가능한지......

PDF 파일 내용 한글파일로...

... 이거 한글파일에 한줄로 한번에 복붙하려면 어떻게 해야하나요?ㅠㅠ 제발 아시는분 알려주세여 조금 투박하지만 복사하기 하신 엑셀에 붙여넣기를 먼저 하시고.......

pdf파일을 한글로 변환 글상자

책자를 스캔한 pdf파일을 한글파일로 변환 위에 글상자를... 변환을 어떻게 하셨는지는 잘 모르겠지만 유료 사이트 변환이 아닌 경우엔 글씨도 이미지로 인식하는...

PDF파일텍스트복사시 폰트가 깨지는...

... 텍스트파일로 변환하거나 PDF에서 텍스트 선택 복사... 그 화일들을 문자인식하기 하면 그림화일이 텍스트... 긁어서 복사&붙이기 하세요. 아르미의 특성상 한글은...

pdf파일 텍스트전환 어떻게하나요

... 전환은 어떻게 하나요? 아이패드 PDF 파일텍스트를 추출하려면 OCR(광학 문자 인식) 기술을 사용해야... - 완료되면, 추출된 텍스트가 보이고, 이를 복사해...

PDF 파일에서 복사해서 MS WORD 2003에...

... 님의 경우처럼요 텍스트 PDF복사하여 워드나 한글로 옮기면 정확도가 50%도 안된다고 보면 됩니다.. 또한 문자인식 프로그램을 사용하여서 PDF 파일을 텍스트...

MS WORD 2013년판 PDF 파일을 텍스트로...

... 이걸 어떻게 텍스트로 편집 가능한 상태로 변경할 수 있을까요? 답변 주시면 감사합니다 scan 하여 pdf 파일... 스캐너를 사게 되면 보통 OCR이라고 해서 문자인식프로...

pdf파일에서 한부분만 잘라서 한글에...

... 싶은데 어떻게 할수있나요? 급합니다. pdf파일 에서 전체를 올리는것 쉽더군요 그 이미지를 원클릭후 복사 한글에 붙혀넣기를 하니 바로되는데, 제가 해야하는것은, 큰...

PDF 텍스트 복사

... 지워서 복사되는건 어떻게 할 방법이 없을거 같군요. 아마도 해당 pdf 문서에 일부 텍스트한글오피스와 호환이... 그런데, pdf를 문서전체로 변환시키면 파일이 커서...