온디바이스 음성 AI 기술을 개발하는 프레리스쿠너가 세계적 권위의 음성·음향·신호처리 학술대회 ‘ICASSP 2024’에서 논문이 채택됐다고 19일 밝혔다.
국제 전기전자공학협회(IEEE)가 주최하는 ‘ICASSP 2024’는 올해 서울 코엑스 컨벤션 센터에서 지난 14일부터 닷새간 열렸다. 구글, 애플, 아마존, 삼성전자, 현대차 등 세계적 기업과 전 세계 인공지능 분야 연구자 4000여명이 참석했다.
이번에 채택된 프레리스쿠너의 논문 ‘WAV2VEC-VC: VOICE CONVERSION VIA HIDDEN REPRESENTATIONS OF WAV2VEC 2.0’은 화자에 대한 어떠한 사전 정보 없이도 음성 변조(voice conversion)가 가능한 다중 화자 음성 변조 기술이 소개됐다.
예를 들어 A화자의 음성을 B화자의 목소리로 변환하고자 할 때, A화자 음성에서 언어적인 정보를 추출하고 B화자 음성에서 목소리 정보를 추출한 후 두 정보를 결합하여 A화자가 발화한 내용을 B화자의 목소리로 발화한 음성을 합성해낸다.
특히 해당 기술에서는 메타에서 개발한 자기 지도 학습 음성 표현 ‘wav2vec 2.0’을 활용해 입력 음성에서 화자의 목소리 및 언어적인 정보를 효과적으로 추출하는데 성공했다.
김기연 프레리스쿠너 대표는 “이번 연구 결과는 단순히 음성 변조 작업에만 국한될 것이 아니라 여러 음성 작업(화자 인식, 화자 분할, 음질 개선, 음성 인식 등)에 적용이 가능할 것으로 기대된다”며 “사용자 간 음성 파일을 공유할 때 해당 기술을 적용해 원본 화자의 목소리를 익명화함으로써 개인정보 유출을 방지할 것”이라고 말했다.
프레리스쿠너는 온디바이스 음성 AI 기술과 개인정보보호 기술을 개발하는 스타트업이다. 지난해 8월 법인설립 이후 2개월만에 블루포인트파트너스로부터 시드투자를 유치하고 핵심 기술을 고도화하고 있다.
- 관련 기사 더 보기
You must be logged in to post a comment.