최신 딥러닝 알고리즘 적용해 복제 음성의 품질과 음성합성 속도를 획기적으로 개선

이러한 가운데, AI 기반 바이오솔루션 기업 에이아이더뉴트리진(대표 김종철)은 지난 15일(월) 인공지능 음성 복제 솔루션 와이즈클로닝(WiseCloning) 3.0을 출시했다고 밝혔다.
이번에 새롭게 출시한 ‘와이즈클로닝 3.0’은 트랜스포머(Transformer), 갠(Gan) 알고리즘 등의 최신 딥러닝 알고리즘을 적용해 복제음성의 품질과 음성합성 속도를 획기적으로 개선시킨 솔루션으로, 음성합성 속도를 기존 대비 3배 이상 높였다. 또한, 최근 ‘음소단위 운율을 반영한 음성합성에 대한 발명’ 특허 승인을 받았다.
와이즈클로닝 3.0은 승인받은 특허를 기반으로 개인 목소리 특성을 더욱 정교하게 추출할 수 있으며, 개인의 음색과 억양을 학습해 자연스러운 음성 합성이 가능하다. 개인별 음성 특징을 파악하는 것과 함께 음성 시그널 및 음절 단위로 학습하는 구조를 바탕으로 각기 다른 목소리를 한국어와 영어로 동시에 서비스할 수 있는 장점이 있다.
경쟁사 대비 에이아이더뉴트리진 음성 복제 솔루션의 차별점은 빠른 속도로 ‘커스터마이징’이 가능하다는 것이다. 표준 인터페이스(API)로 제공하는 것 외에 고객사에 서버 엔진을 구축해 직접 설치 및 운영이 가능하다. 이와 함께 수집되는 음성데이터를 바탕으로 고객의 니즈를 파악하고, 시뮬레이션 및 빠른 피드백을 제공한다. 이를 통해 한층 지능화된 개인 맞춤화 서비스가 가능하고 AI 음성시장에서 특화 솔루션이 될 것으로 기대된다.
AI 사업총괄 이동훈 전무는 “와이즈클로닝에 최신 딥러닝 알고리즘을 적용해 음성 품질과 음성합성 속도를 획기적으로 개선했다”라며, “이를 기반으로 음성복제 기술의 핵심인 발화자의 정교한 특성 인식 및 재현이 가능한 특화 솔루션을 발굴해낸 것이 와이즈클로닝만의 차별점”이라고 밝혔다.
이러한 장점을 바탕으로 에이아이더뉴트리진 와이즈클로닝은 현재 애드테크 기업과 매일경제, 이데일리 등 국내 30여 개 언론사 광고상품에 서비스 중이다.
에이아이더뉴트리진은 앞으로 음성 빅데이터 및 음성인식, 복제, 발화엔진 기술의 내재화를 통해 AI음성 관련 사업을 활발하게 확장한다는 계획이다. 최근 지능형 AI 콜센터를 시작으로 오디오북(Audio Book) 제작 사업과 동영상 더빙, 방송, 교육 등 다양한 비즈니스 영역으로 진출할 것이라고 밝혔다.
한편, 에이아이더뉴트리진은 자연어 처리 머신러닝 기반의 챗봇 서비스 등 언어 처리 분야의 인공지능 기술 전문 기업이다. 현재 딥러닝 기반 AI 음성 복제 사업을 확장해 나가며, 기본 음성 외에 두 가지 이상의 음성을 합성하거나 음의 높낮이와 운율 등을 조절해 사람의 감정을 반영하는 음성합성 기술을 시험 중이다.
또한, 가장 밑바탕인 감정 패턴 별 학습데이터 구축 작업에도 많은 투자를 진행하고 있는데, 이를 실생활 및 다양한 응용 분야에 적용시켜 AI 스피커와 같이 누구나 쉽고 편리하게 이용할 수 있는 서비스를 구현할 계획인 것으로 알려졌다.
news@beyondpost.co.kr