문자인식

문자인식

[ character recognition , 文字認識 ]

요약 인쇄되거나 손으로 쓴 문자를 컴퓨터가 자동으로 찾아 인식하게 하는 기술을 말하며, 그 방법으로는 패턴 정합법(pattern matching)과 구조 분석법(structure analysis)이 있다.

패턴인식의 한 분야로 인쇄되거나 손으로 쓴 문자를 자동으로 판독·식별하여 컴퓨터가 이해할 수 있는 코드로 전환하는 기술로써 컴퓨터의 입력 작업을 키보드를 통하지 않고 직접 행할 수 있다.

문자인식장치는 광전변환장치, 인식처리장치, 기억장치, 출력장치로 구성된다. 광전변환장치는 지면의 문자를 전압 파형으로 변환하고 이때 지면의 2차원 도형인 문자의 형상은 TV와 같은 방식인 주사(scan)에 의해 전압 파형의 시계열 변화인 1차원 신호로 변환한다. 기억장치는 인식처리장치를 제어하는 연산 제어 프로그램과, 인식한 형상을 특정한 형태로 표현한 데이터를 저장한다.

인식처리장치는 기억장치상 프로그램의 제어에 따라 광전변환장치를 통해 미지의 문자를 입력하여 처리하고, 같은 기억장치 내의 표준 패턴과 비교하여 가장 일치도가 높은 패턴에 해당되는 문자의 종류가 미지 문자의 글자 종류로 인식된다. 출력장치는 인식된 문자를 컴퓨터나 그밖의 정보처리장치에 전달하기 쉬운 형태로 전달한다.

문자인식을 할 수 있는 기기로는 인쇄문자와 필기문자를 모두 인식할 수 있는 광학식 문자판독기(Optical Character Reader:OCR), 필기문자를 인식할 수 있는 태블릿(tablet), 특수 문자를 인식할 수 있는 광학식 마크판독기(Optical Mark Reader:OMR), 바코드, 자기잉크판독기(Magnetic Ink Character Reader:MICR) 등이 있다.

OCR에 의한 인식은 판독한 결과의 신뢰성이 중요하므로 인식 정보를 확보하기 위해서는 입력되는 문자에 어느 정도의 제한이 따른다. OCR 인쇄문자의 표준 자형에는 OCR-A와 OCR-B가 있으며, 초기에는 OCR-A형 사용되었으나 현재는 사람이 읽기 쉽지 않다는 이유로 OCR-B형이 사용되고 있다.

필기문자는 인쇄문자와 달리 기계적인 치수로 그 형상을 엄격히 규정하기 어려우므로 인식하는데 여러 문제가 있다. 일반적인 지표로는 문자를 구성하는 특징적인 선을 명확하게 구별할 수 있을 것, 쓰기 쉬울 것, 자연스러운 자형일 것 등이 주로 검토되고 있다. 또한 필기문자의 크기와 형상을 안정시킬 목적으로 문자 기입란의 크기와 모양을 동시에 제한하고 있다.

종래의 문자인식 방법은 크게 패턴 정합법(pattern matching)과 구조 분석법(structure analysis)으로 분류할 수 있다. 전자는 주로 인쇄문자의 인식에, 후자는 주로 필기문자의 인식에 사용된다. 양자의 중간적인 문자인식 방식으로 특징 정합법(feature matching) 및 획 분석법(stroke analysis) 등이 있으며, 각각의 용도나 목적에 맞추어 구분하여 사용하고 있다.

영상인식시스템(Image Recognition System), 음성인식장치(Voice Recognition)와 함께 차세대 입력장치로 꼽히고 있다.