| 연구목표 |
인간의 음성 생성 및 인지 시스템의 연쇄 작용을 모델링하여 스스로 발전하고 성능을 개선하는 end-to-end 음성합성-음성인식-화자인식 통합 모델 개발1) 청각인지모델의 음성 연쇄 개념에 입각한 음성인식 및 음성합성 준교사 통합 학습모델 연구 및 개발2) 화자인식기의 one-shot 화자적응에 기반한 효과적 음성복제 및 음성인식 성능 향상3) 합성음 음질... |
| 연구내용 |
1) 청각인지모델의 음성 연쇄 개념에 입각한 음성인식 및 음성합성 준교사 통합 학습모델 연구 및 개발● 음성인식(speech-to-text, STT)과 음성합성(text-to-speech, TTS)의 개념적인 역관계를 이용한 음성 연쇄 모델 개발 및 통합 훈련(joint training) 프레임워크 구현● 음성 연쇄의 청각 피드백을 기반으로 하는 준교사 학... |
| 기대효과 |
스마트폰의 음성비서나 AI 스피커에 탑재된 기존 음성인식 및 음성합성 기술로는 개인화된 서비스를 제공하는 데 어려움이 따름.● 음성비서나 AI 스피커의 사용자들이 늘어남에 따라 기존에 탑재된 목소리가 아닌 특정 개인의 목소리로 음성을 합성하고자 하는 수요가 급격히 증가함. 이러한 수요에 맞는 상용 서비스를 공급하기 위해서는 몇 분 정도의 적은 분량으로 개인... |
| 키워드 |
음성 연쇄작용,심층학습,종단간 음성인식,종단간 음성합성,상호학습,one-shot 화자적응,준교사 학습,음성복 |