자연어를 이해하는 실용 인공지능(AI) 기술 기업 무하유가 챗GPT가 쓴 문장을 찾아내는 GPTKiller(이하 GPT킬러) 솔루션을 개발 완료했다.
무하유는 지난 12년간 AI기반의 표절검사 서비스인 카피킬러를 운영하며 축적된 문서 데이터와 무하유만의 한국어 자연어 이해(NLU, Natural Language Understanding) 노하우를 접목시키며 국내 최초로 디텍트GPT(Detect GPT) 기술 개발에 성공했다. 오는 9월부터 카피킬러에 GPT 킬러 기능을 추가 적용하고, 제출된 과제물 및 논문에 챗GPT가 작성한 문장이 있는지 찾을 수 있도록 서비스할 방침이다.
GPT 킬러는 문장 속 단어와 어순 관계를 추적해 맥락과 의미를 학습하는 AI 신경 모델인 트랜스포머를 기반으로 한다. 한국어 자연어 이해모델을 학습한 AI가 검사 문서를 문단 단위로 분할한 후 각 문단에 대한 챗GPT 작성 확률을 분석한다. 검출을 원하는 문단과 이전 맥락을 고려한 후, 입력된 값을 결과에 따라 참 또는 거짓 형태로 분류해 챗GPT 작성 여부를 판단하는 이진분류(Binary Classification) 방식이다.
무하유는 그간 카피킬러로 표절 검사 분야에서 쌓아온 독보적인 기술력과 서비스 노하우를 바탕으로 표절 판단 기준에 대한 밸런스를 맞춰왔다. 이번 GPT킬러 역시 그동안의 경험과 노하우를 통해 챗GPT가 만든 문장의 표절 여부를 보수적인 관점에 검사하고 판단한다.
GPT 킬러는 챗GPT가 만든 문장을 찾아내는 디텍트 GPT 솔루션 중 유일하게 AI가 쓴 한국어 문장까지 잡아낼 수 있다. 시장에 알려진 기존 디텍트 GPT 솔루션들은 한국어 학습 AI를 적용한 사례가 전무하다. 한국어 입력이 가능한 서비스일지라도 내용을 정상적으로 판별할 수 없는 경우가 대다수다.
반면 무하유의 GPT 킬러는 AI가 한국어를 학습해 한글 지원이 가능함은 물론, 한국어로 입력을 해도 안정적으로 서비스 이용이 가능하다. 실제 무하유가 해외 디텍트 GPT 프로그램들과 비교해 본 결과, GPT 킬러는 한국어를 사용했을 때 타사 솔루션 대비 거짓 데이터를 찾아낸 비율이 더 높고, 오검출 없이 실제로 잡아내야 하는 문제를 더 잘 잡아내는 것으로 나타났다.
무하유의 신동호 대표는 “챗GPT가 쓴 글의 유효성을 검사하는 일은 카피킬러로 12년간 논문 표절 검사를 진행하면서 과탐지 및 오탐지에 대한 기준을 확립해 온 무하유가 제일 잘 할 수 있는 일이다. 카피킬러로 쌓아 온 비즈니스 경쟁력과 시장 점유율을 활용해 GPT킬러를 생성 AI를 올바르게 활용할 수 있는 도구로 만드는 게 목표”라고 말했다.
- 관련 기사 더보기
You must be logged in to post a comment.