플리토, ‘Open Ko-LLM 리더보드’에 벤치마크 데이터셋 제공

인공지능(AI) 언어 데이터 전문 기업 플리토는 12일 한국어 초거대언어모델의 성능을 비교·평가하는 ‘Open Ko-LLM 리더보드’에 벤치마크 데이터셋을 제공했다고 밝혔다.

’Open Ko-LLM 리더보드’는 한국지능정보사회진흥원(NIA)과 업스테이지가 함께 구축하고 운영 중인 한국어 대규모 언어 모델(LLM) 성능 평가 플랫폼이다. 이 플랫폼은 국내 기업과 연구기관이 대규모 언어 모델(LLM)을 등록하고 성능 경쟁을 할 수 있는 환경을 제공하여 한국형 인공지능 개발과 자연어 처리 기술의 발전에 기여하고 있다.

플리토는 ‘Open Ko-LLM 리더보드’를 운영 중인 업스테이지의 파트너사로서 ▲상식 추론과 문맥 이해 능력 ▲수학적 추론과 계산능력 등을 평가할 수 있는 벤치마크 데이터셋을 한국어로 제공했다. 이를 통해 기존 평가 항목인 ▲추론 능력 ▲상식 능력 ▲언어 이해력 ▲환각 방지 능력 ▲한국어 상식 생성 능력 등 뿐만 아니라 더 풍부한 성능 테스트 비교가 가능하게 됐다.

플리토는 이번 데이터셋 구축 참여를 계기로 한국어 대규모 언어 모델의 성능을 평가하고 향상시키기 위한 고품질 언어 데이터 구축에 박차를 가할 예정이다.

플리토 이정수 대표는 “이번 벤치마크 데이터셋 제공을 통해 한국어 대규모 언어 모델 리더보드가 국제적인 평가 기준을 갖추게 되어 의미가 크다”며 “다년간 쌓아온 언어 데이터 구축 기술 능력을 바탕으로 한국형 인공지능 생태계 발전에 더욱 힘을 쏟겠다”고 말했다.

 


  • 관련 기사 더보기
%d bloggers like this: