AI OCR 기술은 이미지를 구조화된 형태로 변환해 AI 모델이 텍스트 데이터를 학습하고 이해할 수 있도록 하는 기술로 인공지능(AI) 및 머신러닝(ML) 분야에서 매우 중요한 기반 기술이다. 최근 월스트리트저널(WSJ)은 기사를 통해 미국의 AI 빅테크는 이미 대다수의 텍스트를 학습해 추가로 학습할 데이터가 부족한 상황임을 지적했다.
이런 상황에서는 더 많은 비정형데이터의 처리가 필요하고 이를 위해서는 AI OCR과 같은 고도화된 기술이 더 요구된다. 예를 들어 많은 기업과 기관은 여전히 종이 문서와 이미지 형식의 데이터에 의존하고 있는데, 이런 데이터는 AI 및 ML 시스템이 학습하고 분석할 수 있는 형태로 전환되지 않으면 활용될 수 없다. 특히 자체 LLM을 개발하려면 내부 데이터가 중요한데, 이런 이미지 형식의 내부 데이터 학습에 AI OCR 기술의 적용 여부가 자체 LLM AI의 정확도와 정보성의 성패를 가르기도 한다.
AI OCR 기술은 인쇄 품질, 폰트 전환 범위, 배경 질감, 언어, 손글씨체 등 고려해야 하는 개발 변수가 매우 많다. 특히 정확하고 빠르게 데이터를 처리하는 것은 정교한 알고리즘과 방대한 훈련 데이터 없이는 개발이 불가능 하다. 게다가 한국어는 영문보다 복잡하기 때문에 글로벌 OCR 솔루션의 한국어 처리 정확도는 영문 대비 평균 10% 낮아진다. 결국 한국어 데이터를 활용하기 위해서는 한국어에 특화된 AI OCR이 필요하다는 의미이다.
비큐AI는 기존에 세계 최고 수준의 해외 A사 OCR 솔루션을 사용해 왔으나 5일 자체 기술 개발을 통해 확보된 AI OCR 솔루션 ‘Be Reader’로 전면 교체한다고 발표했다.
비큐AI 관계자는 “내부 성능 검증 결과, 기존에 사용 중이던 해외 A사 OCR보다 ‘Be Reader’의 인식률이 대폭 향상되었고, 이는 전체적인 데이터 정확성과 처리 속도 역시 향상되었다”고 설명했다. 비큐AI는 앞으로 전개할 다양한 AI 사업에 ‘Be Reader’를 자사 제품과 서비스에 적극 적용할 예정이다.
비큐AI 관계자는 “‘Be Reader’는 기존 외산 제품이 가지는 리스크 요인을 줄이고자 오픈소스를 기반으로 자체적으로 데이터 학습과 정확도 향상을 위한 기술 개발 노력 끝에 성능을 크게 향상시킨 것”이라면서, “다른 OCR 제품들과 비교하면 A1 대형 사이즈의 이미지에 대한 학습과 고도화를 통해 단으로 구분된 이미지 내 텍스트 순서를 정확하게 구분하고 인식하는 기능이 월등해 비교 제품군의 평균 91.6% 수준의 인식률이 ‘Be Reader’의 경우 최대 96.7% 수준으로 내부 평가에서 확인했다”고 전했다.
또한 “‘Be Reader’를 통해 국내외 논문, 잡지, 학술지 등 다양한 종류의 자료에서 고객인 원하는 형태의 데이터로 제공함에 있어 고객에게 최적의 서비스를 제공할 수 있다”면서 “‘Be Reader’를 통해 AI 데이터 확보 과정에서 소요되는 고객의 시간과 비용이 크게 절감돼 당사 AI 사업의 경쟁력이 한층 더 강화될 것”이라고 전했다.
한편 비큐AI는 이미 자체 데이터 처리 기술을 통해 고품질의 뉴스 데이터를 국내 주요 대기업에게 AI용 학습 목적으로 제공하고 있고, 최근 해외 AI 빅테크와의 사업기회를 모색하는 등 AI 사업에 역량을 집중하는 것으로 알려졌다.
- 관련 기사 더 보기
You must be logged in to post a comment.