자연어를 이해하는 실용 AI 기술 기업 무하유가 2년 연속 ‘국회도서관 융복합서비스 데이터셋 구축 사업’의 주관사업자로 선정됐다고 25일 밝혔다.
무하유는 국회도서관에서 제공 중인 AI 의정분석 서비스 ‘아르고스’에 정책 이슈, 통계용어, 뉴스기사·법률명 매핑 데이터셋 등을 구축함으로써 아르고스의 뉴스 분석 서비스를 지원할 예정이다.
구축 데이터셋의 종류는 정책 이슈 모니터링, 뉴스 기사 문맥에 따른 긍·부정 반응, 통계 및 일반용어, 법률 및 이슈 연혁, 표·그림 등이다. 법률에 해당하는 이슈 키워드와 제개정일·의안·회의록·주요 사건 및 인물에 대한 정보는 물론, 통계 표의 제목 및 매칭 키워드 등도 구축할 계획이다.
무하유는 데이터셋 구축 전문 플랫폼인 ‘데이터 팩토리’를 운영하고 있다. 지난 13년간 AI 표절검사 서비스 카피킬러, AI 채용 서비스 프리즘, AI 면접 서비스 몬스터 등을 개발 및 운영하며 구축해 온 노하우가 집약됐다.
무하유는 13년간 축적한 문서 데이터와 한국어 자연어 이해(NLU) 노하우를 토대로 한 ‘빅데이터 자동화 처리 기술’을 보유 중이다. 데이터 팩토리를 통해 AI 적용 솔루션을 운영하는 과정에서 필요한 데이터를 자체적으로 구축한 후 정제 및 가공하기 때문에 데이터 구축과 품질관리가 용이하고, 고품질의 학습 데이터셋 구축이 가능하다.
무하유의 신동호 대표는 “공공부문 데이터베이스 구축 사업에 진출, 무하유만의 기술 및 인적 노하우를 적용해 성공사례를 늘려가고 있다”며, “민간기업에서 필요로 하는 데이터셋까지 영역을 확대해 계약을 논의 중이다. 검증된 AI 기술에 기반한 데이터셋 제작 역량으로 다양한 분야에 진출할 예정”이라고 설명했다.
- 관련 기사 더보기
You must be logged in to post a comment.