엔씨소프트, 캐릭터 음성 자동 제작 AI ‘멀티버스 TTS’ 공개

김진수 기자 2024-10-08 15:07:44
엔씨소프트가 게임 음성제작 과정 전반에 활용할 수 있는 AI 모델 ‘Zero-shot Multi-verse TTS(이하 멀티버스 TTS)’를 8일 공개했다. TTS(Text to Speech)는 자연어를 입력해 캐릭터 목소리 같은 음성 콘텐츠를 제작하는 음성 합성 기술이다. 엔씨가 공개한 ‘멀티버스 TTS’는 3초 분량의 프롬프트 음성만으로도 ▲다양한 발화 스타일 변환 ▲화자 음색 일치도가 높은 교차 언어 생성 ▲다국어 음성 제작이 가능하다.

엔씨는 ‘멀티버스 TTS’ 기술을 게임 음성 제작 과정 전반에 활용할 계획이다. 해당 모델을 활용하면 제한된 음성 리소스를 활용해 고품질의 풍부한 AI 캐릭터 보이스 제작이 가능해 기존 음성 작업에 소요되던 시간과 비용을 크게 절감할 수 있다.

단일 모델로 구동이 가능한 점도 특징이다. ‘멀티버스 TTS’는 여러가지 언어와 기능을 가진 TTS를하나의 모델로 제공해 다국어 음성 콘텐츠를 제작한다. 최적화된 하나의 모델을 활용하는 만큼 경쟁 TTS 모델에 비해 상대적으로 적은 운용 비용으로 고품질의 음성 생성 서비스를 제공한다.

엔씨는 단일 모델로 다양한 스타일의 언어와 음성을 생성하는 ‘멀티버스 TTS’ 모델 논문을 세계적인 권위를 갖는 인공지능 관련기술 학회 ‘EMNLP(Empirical Methods in Natural Language Processing)‘에 게재하며 글로벌 기술력 입증에도 성공했다.

현재 엔씨는 글로벌 게임 출시를 위해 다국어 음성 AI 연구 개발에 매진하고 있다. 이번 ‘멀티버스 TTS’를 시작으로 연내 100종의 게임 캐릭터 음성을 제작하고, NPC의 성격과 상황에 맞춰 음성을 제작하는 조절 기능을 지속 개발하는 것이 목표다.

댓글

(0)
※ 댓글 작성시 상대방에 대한 배려와 책임을 담아 깨끗한 댓글 환경에 동참에 주세요. 0 / 300

"강원랜드 수사도 다시 해야"

국민의힘 권성동 의원이 정치자금법 위반 혐의를 받는 피의자 신분으로 특검에 소환됐다. 권 의원이 결백을 주장한 가운데 누리꾼들은 철저한 특검 수

전남 합계출산율 2년 연속 전국 1위

전남도는 2024년 전남지역 합계출산율이 1.03명으로 2년 연속 전국 1위를 기록한데 이어 2025년 2분기 합계출산율도 1.04명으로 전국에서 유일하게 1.0명을

HD현대중공업, HD현대미포와 합병

HD한국조선해양이 마스가(MASGA) 프로젝트의 본격 가동을 앞두고 조선업 사업재편을 통한 K-조선 및 방산 분야 글로벌 경쟁력 제고와 수주 확대에 나선다