| 연구목표 |
* 소량의 음성 데이터를 사용한 딥러닝 기반 고품질, 종단형, 실시간, 적응형 화자 변환 및 다화자 한국어 음성합성 기술* 고품질 한국어 음성합성 기술 - 1인 화자: MOS 4.2 이상, 다화자: MOS 4.0 이상, 음색 유사도 80% 이상* 딥러닝 기반 종단형 방식 음성합성 기술* 실시간 처리 음성합성 기술* 소량의 데이터를 사용한 적응형 화자 변환 ... |
| 연구내용 |
1) 1차년도 연구내용* 선행 연구에서 구축한 음성합성 시스템 학습용 대용량 1인 화자 및 소용량 다화자 한국어 음성 DB 정리 - 1인 화자: 13,000 문장, 약 18 시간 - 소용량 다화자: 50인, 화자당 300 문장(30 분) 이하* 선행 연구를 이용한 1인 화자 딥러닝 기반 고품질 종단형 실시간 음성합성 기술 연구 - 실시간 처리를 위한 Tex... |
| 기대효과 |
- 국내외 논문 3편 이상 발표를 목표로 하는데, 이를 통해 국내 기술의 경쟁력을 확보할 것으로 기대됨- 현재는 대량의 데이터와 전문가의 상당한 노력이 필요하나, 전문가의 개입 없이 소량의 데이터로도 학습이 가능한 종단형 음성합성 기술은 기존 기술을 대체할 수 있는 우수한 기술임- 전 세계적으로 대용량 DB 수집이 가능한 몇몇 기관에서만 음성합성 연구가 진... |
| 키워드 |
한국어 TTS, 다중 화자,딥러닝,실시간 |