OCR(광학문자판독기) 기술은 이미지나 문서의 글자를 인식해 디지털 데이터로 변환시켜주는 기술로 다양한 분야에서 널리 활용되고 있다. 최근에는 고객이 스마트폰으로 촬영한 다양한 유형의 문서 처리 업무에 사용하는 경우가 많아지면서 전통적인 OCR 기술의 한계를 넘어선 AI 기술을 활용한 새로운 접근법이 도입되고 있다고 업체 측은 설명했다.
트윈리더의 새로운 버전 2.1은 AI를 기반으로 한 OCR 제품으로, 이미 여러 보험사 등을 대상으로 현장에서의 경험과 노하우를 반영해 한 걸음 더 개선된 버전이다. 머신러닝 기반의 글자의 인식/이해용 모델 외에 룰 기반의 표 이해 기능 등을 탑재해 관리자가 쉽게 추가로 장표 유형별 양식을 등록할 수 있는 워크벤치 등의 도구 등이 탑재됐다.
또한 글자 외에 특수문자의 인식과 사용자가 지정한 정확도에 미치지 못 하는 내용에 대한 하이라이트 처리 기능 등을 통해 문제시 되는 내용만을 재점검, 수정할 수 있도록 하는 등 자기신뢰도 기능 등이 탑재돼 인식률의 제고 및 이미지 처리와 관련한 실질적 자동화율을 높일 수 있도록 하였다.
추가로 AI 기반의 자연어처리 기술을 융합해 단어의 의미와 노출빈도를 파악해 문서의 분류, 저장하는 기능과 자주 사용하는 단어사전을 정의해, 인식된 글자의 오/탈자를 자동으로 보정하는 기능 등을 탑재하고 있다.
애자일소다의 최대우 대표이사는 “이번 성능 개선과 자연어처리 기술과 융합한 알고리즘 등을 보강한 신규 버전 출시로 금융권 외에 다양한 업종으로 확대할 것”이라며, “당사의 모델옵스(ModelOps) 제품인 스파클링소다의 Ops 환경 기반위에서 여러 자사 제품들과의 융합, 확대를 통해 향후 IDP(Intelligent Document Processing) 분야의 선도제품으로 나설 것”이라고 말했다.
editor@itworld.co.kr