관리자
64
2024-05-22
내역사업 | 기본연구 |
---|
과제명 | 강화학습의 제어적 해석과 설계 | ||||
---|---|---|---|---|---|
과제고유번호 | 1711136014 | ||||
부처명 | 과학기술정보통신부 | ||||
시행계획 내 사업명 | |||||
시행계획 내 사업유형 | 예산출처지역 | 대전광역시 | 사업수행지역 | 대전광역시 | |
계속/신규 과제구분 | 신규과제 | ||||
과제수행연도 | 2021 | 총연구기간 | 2021-06-01 ~ 2024-02-29 | 당해연도 연구기간 | 2021-06-01 ~ 2022-02-28 |
연구목표 | 최근 알파고에서 사용한 심층신경망을 기반으로 한 강화학습 은 강화학습의 패러다임을 변화시켰고 자율주행 자동차, 로봇, 전력제어, 교통망 제어, 헬스케어 등과 같은 다양한 현실 속 문제들에 적용되고 있다. 하지만 아직 사람들은 왜 그 접근법이 성공적인지에 대해 매우 제한 적인 이해를 하고 있다. 이러한 본질적인 이해는 이론적인 영역을 넘어서 새로운 알고리즘을... | ||
---|---|---|---|
연구내용 | 동적 제어 시스템 관점에서의 강화학습 알고리즘을 연구하여 새로운 강화학습 해석을 제시한다. 동적 시스템 제어에 사용되는 강인제어, 비선형제어, 적응제어 기법들을 강화학습 해석에 적용하여 기존의 그리고 최근의 강화학습에 대한 이론적인 규명을 시도한다. 또한 이를 통해서 새로운 강화학습 알고리즘을 개발한다. 1년차에는 주로 제어 시스템 이론의 기초연구에 집중한... | ||
기대효과 | 한국은 중국 미국등 인공지능 강국에 비해서 강화학습 연구가 뒤쳐진 상태이다. 본 연구는 기존 연구의 단순 확장이나 응용 연구가 아닌 새로운 패러다임을 만들어 낼 수 있다고 확신한다. 이를 통해서 강화학습 분야에서 이들 국가들을 뛰어 넘을 수 있다. 또한 한국의 기초과학 기술을 발전 시키고 명성과 역량을 대외적으로 알릴 수 있다. 인공지능의 국가 기반기술을 ... | ||
키워드 | 제어 시스템,강화학습,인공지능,머신 러닝,수렴성 해석,최적제어 |
단독연구 | 기업 | 대학 | 국공립(연)/출연(연) | 외국연구기관 | 기타 |
---|---|---|---|---|---|
|
연구개발단계 | 기초연구 | 산업기술분류 | |
---|---|---|---|
미래유망신기술(6T) | IT(정보기술) | 기술수명주기 | |
연구수행주체 | 학 | 과학기술표준분류 | 인공물 > 전기/전자 > 기타전기/전자 > 달리 분류되지 않는 전기/전자 |
주력산업분류 | 적용분야 | 기타 산업 | |
중점과학기술분류 | 과제유형 |
과제수행기관(업) 정보 | 과제수행기관(업)명 | 한국과학기술원 | 사업자등록번호 | |
---|---|---|---|---|
연구책임자 | 소속기관명 | 한국과학기술원 | 사업자등록번호 | |
최종학위 | 박사 | 최종학력전공 | 공학 |
국비 | 39,838,000 | 지방비(현금+현물) | 0 |
---|---|---|---|
비고 |