관리자
47
2024-05-21
내역사업 | 중견후속연구(연평균연구비 1억원 이내) |
---|
과제명 | 초소용량 데이터베이스를 이용한 극소수 학습 기반 한국어 다화자 End-to-end 음성 합성기 개발 | ||||
---|---|---|---|---|---|
과제고유번호 | 1711112223 | ||||
부처명 | 과학기술정보통신부 | ||||
시행계획 내 사업명 | |||||
시행계획 내 사업유형 | 예산출처지역 | 대전광역시 | 사업수행지역 | 대전광역시 | |
계속/신규 과제구분 | 신규과제 | ||||
과제수행연도 | 2020 | 총연구기간 | 2020-03-01 ~ 2022-02-28 | 당해연도 연구기간 | 2020-03-01 ~ 2021-02-28 |
연구목표 | 본 연구는, 선행연구를 통해 개발한 '소용량 데이터베이스(DB)를 이용한 전이 학습(transfer learning) 기반 음성 합성 시스템'을 고도화화여, 초소용량 DB를 이용한 few shot learning 기반의 다화자 end-to-end 음성 합성 시스템을 구축하는 것을 목표로 한다. 선행연구에서는 대용량의 영어 DB를 활용하여, 훈련된 뉴럴 보코... | ||
---|---|---|---|
연구내용 | 음성 합성 시스템 훈련용 한국어 음성 DB 구축 및 정리- 최근 AI 분야 기술 경쟁의 우위 확보를 위해 다양한 한국어 DB들이 연구용으로 오픈되고 있으므로 공개된 DB를 분석하여 고품질의 한국어 음성 DB 중 한 화자당 500문장 이하로 발화하였으며 6명 이상의 화자가 발화한 음성 데이터를 수집- 음성 합성 훈련용으로 사용되어야 하므로 음소균형과 어휘균형... | ||
기대효과 | 최근 10여 년간은 DNN (deep neural network)의 발전으로 인해 Tacotron, Deep voice 3등 다양한 음성 합성 기술이 연구되었고, 기술의 발전 수준 또한 높아 합성기를 내재한 AI 스피커가 많이 사용되고 있다. 하지만 현재 상용화된 음성 합성기는, 소수의 음색만을 표현할 수 있고, 합성 모델의 원활한 학습을 위해서는 대용량의... | ||
키워드 | 음성 합성,극소수 학습,다화자 음성 합성,초소용량 음성 데이터베이스,인공지능 스피커 |
단독연구 | 기업 | 대학 | 국공립(연)/출연(연) | 외국연구기관 | 기타 |
---|---|---|---|---|---|
|
연구개발단계 | 기초연구 | 산업기술분류 | |
---|---|---|---|
미래유망신기술(6T) | IT(정보기술) | 기술수명주기 | |
연구수행주체 | 학 | 과학기술표준분류 | 인공물 > 전기/전자 > 가정용기기/전자응용기기 > 음성정보기술 응용기기 |
주력산업분류 | 적용분야 | 제조업(전자부품,컴퓨터,영상,음향및통신장비) | |
중점과학기술분류 | 과제유형 |
과제수행기관(업) 정보 | 과제수행기관(업)명 | 한국과학기술원 | 사업자등록번호 | |
---|---|---|---|---|
연구책임자 | 소속기관명 | 한국과학기술원 | 사업자등록번호 | |
최종학위 | 박사 | 최종학력전공 | 공학 |
국비 | 90,000,000 | 지방비(현금+현물) | 0 |
---|---|---|---|
비고 |