대전과학기술정보서비스

search

로그인

R&D 정보

과제 상세정보

음성 연쇄작용의 심층학습에 기반을 둔 종단간 음성인식 및 합성 통합 상호 학습기법 연구

작성자

관리자

조회수

132

등록일

2024-05-22

사업 정보

내역사업	(유형1-1)중견연구

과제 기본정보

과제명	음성 연쇄작용의 심층학습에 기반을 둔 종단간 음성인식 및 합성 통합 상호 학습기법 연구
과제고유번호	1711131427
부처명	과학기술정보통신부
시행계획 내 사업명
시행계획 내 사업유형		예산출처지역	대전광역시	사업수행지역	대전광역시
계속/신규 과제구분	신규과제
과제수행연도	2021	총연구기간	2021-03-01 ~ 2026-02-28	당해연도 연구기간	2021-03-01 ~ 2022-02-28

요약 정보

연구목표	인간의 음성 생성 및 인지 시스템의 연쇄 작용을 모델링하여 스스로 발전하고 성능을 개선하는 end-to-end 음성합성-음성인식-화자인식 통합 모델 개발1) 청각인지모델의 음성 연쇄 개념에 입각한 음성인식 및 음성합성 준교사 통합 학습모델 연구 및 개발2) 화자인식기의 one-shot 화자적응에 기반한 효과적 음성복제 및 음성인식 성능 향상3) 합성음 음질...
연구내용	1) 청각인지모델의 음성 연쇄 개념에 입각한 음성인식 및 음성합성 준교사 통합 학습모델 연구 및 개발● 음성인식(speech-to-text, STT)과 음성합성(text-to-speech, TTS)의 개념적인 역관계를 이용한 음성 연쇄 모델 개발 및 통합 훈련(joint training) 프레임워크 구현● 음성 연쇄의 청각 피드백을 기반으로 하는 준교사 학...
기대효과	스마트폰의 음성비서나 AI 스피커에 탑재된 기존 음성인식 및 음성합성 기술로는 개인화된 서비스를 제공하는 데 어려움이 따름.● 음성비서나 AI 스피커의 사용자들이 늘어남에 따라 기존에 탑재된 목소리가 아닌 특정 개인의 목소리로 음성을 합성하고자 하는 수요가 급격히 증가함. 이러한 수요에 맞는 상용 서비스를 공급하기 위해서는 몇 분 정도의 적은 분량으로 개인...
키워드	음성 연쇄작용,심층학습,종단간 음성인식,종단간 음성합성,상호학습,one-shot 화자적응,준교사 학습,음성복

위탁/공동여부 정보

단독연구	기업	대학	국공립(연)/출연(연)	외국연구기관	기타

기술 정보

연구개발단계	기초연구	산업기술분류
미래유망신기술(6T)	IT(정보기술)	기술수명주기
연구수행주체	학	과학기술표준분류	인공물 > 전기/전자 > 가정용기기/전자응용기기 > 음성정보기술 응용기기
주력산업분류		적용분야	제조업(전자부품,컴퓨터,영상,음향및통신장비)
중점과학기술분류		과제유형

과제수행기관(업) 정보

과제수행기관(업) 정보	과제수행기관(업)명	한국과학기술원	사업자등록번호
연구책임자	소속기관명	한국과학기술원	사업자등록번호
연구책임자	최종학위	박사	최종학력전공	공학

사업비

국비	119,468,000	지방비(현금+현물)	0
비고

사업 정보

내역사업	(유형1-1)중견연구

과제 기본정보

과제명	음성 연쇄작용의 심층학습에 기반을 둔 종단간 음성인식 및 합성 통합 상호 학습기법 연구
과제고유번호	1711131427
부처명	과학기술정보통신부
시행계획 내 사업명
시행계획 내 사업유형
예산출처지역	대전광역시
사업수행지역	대전광역시
계속/신규 과제구분	신규과제
과제수행연도	2021
총연구기간	2021-03-01 ~ 2026-02-28
당해연도 연구기간	2021-03-01 ~ 2022-02-28

요약 정보

연구목표	인간의 음성 생성 및 인지 시스템의 연쇄 작용을 모델링하여 스스로 발전하고 성능을 개선하는 end-to-end 음성합성-음성인식-화자인식 통합 모델 개발1) 청각인지모델의 음성 연쇄 개념에 입각한 음성인식 및 음성합성 준교사 통합 학습모델 연구 및 개발2) 화자인식기의 one-shot 화자적응에 기반한 효과적 음성복제 및 음성인식 성능 향상3) 합성음 음질...
연구내용	1) 청각인지모델의 음성 연쇄 개념에 입각한 음성인식 및 음성합성 준교사 통합 학습모델 연구 및 개발● 음성인식(speech-to-text, STT)과 음성합성(text-to-speech, TTS)의 개념적인 역관계를 이용한 음성 연쇄 모델 개발 및 통합 훈련(joint training) 프레임워크 구현● 음성 연쇄의 청각 피드백을 기반으로 하는 준교사 학...
기대효과	스마트폰의 음성비서나 AI 스피커에 탑재된 기존 음성인식 및 음성합성 기술로는 개인화된 서비스를 제공하는 데 어려움이 따름.● 음성비서나 AI 스피커의 사용자들이 늘어남에 따라 기존에 탑재된 목소리가 아닌 특정 개인의 목소리로 음성을 합성하고자 하는 수요가 급격히 증가함. 이러한 수요에 맞는 상용 서비스를 공급하기 위해서는 몇 분 정도의 적은 분량으로 개인...
키워드	음성 연쇄작용,심층학습,종단간 음성인식,종단간 음성합성,상호학습,one-shot 화자적응,준교사 학습,음성복

위탁/공동여부 정보

단독연구	기업	대학	국공립(연)/출연(연)	외국연구기관	기타

기술 정보

연구개발단계	기초연구
산업기술분류
미래유망신기술(6T)	IT(정보기술)
기술수명주기
연구수행주체	학
과학기술표준분류	인공물 > 전기/전자 > 가정용기기/전자응용기기 > 음성정보기술 응용기기
주력산업분류
적용분야	제조업(전자부품,컴퓨터,영상,음향및통신장비)
중점과학기술분류
과제유형

과제수행기관(업) 정보

과제수행기관(업) 정보
과제수행기관(업)명	한국과학기술원
사업자등록번호
연구책임자
소속기관명	한국과학기술원
사업자등록번호
최종학위	박사
최종학력전공	공학

사업비

국비	119,468,000
지방비(현금+현물)	0
비고