관리자
84
2024-05-21
내역사업 | 신임교원정착연구비 |
---|
과제명 | 동적시스템 관점의 강화학습과 기계학습 | ||||
---|---|---|---|---|---|
과제고유번호 | 1711125380 | ||||
부처명 | 과학기술정보통신부 | ||||
시행계획 내 사업명 | |||||
시행계획 내 사업유형 | 예산출처지역 | 대전광역시 | 사업수행지역 | 대전광역시 | |
계속/신규 과제구분 | 신규과제 | ||||
과제수행연도 | 2020 | 총연구기간 | 2020-02-15 ~ 2023-12-31 | 당해연도 연구기간 | 2020-02-15 ~ 2020-12-31 |
연구목표 | 연구의 목표는 강화학습의 이론적 규명과 새로운 강화학습 알고리즘 개발입니다. 최근 알파고에서 사용한 신경망을 기반으로 한 강화학습 은 강화학습의 패러다임을 변화시켰고 이로 인해 사람들은 강화학습에 대한 많은 관심을 가지게 되었습니다. 또한 이런 강화학습 기법들은 자율주행 자동차, 로봇, 전력제어, 교통망 제어, 헬스케어 등과 같은 다양한 현실 속 문제들에 ... | ||
---|---|---|---|
연구내용 | 최근에 강화학습 알고리즘을 제어와 동적 시스템의 관점에서 해석하는 연구가 몇몇 연구자들에 의해서 진행되고 있습니다. 지금까지 강화학습과 제어는 다른 영역이었지만 두 영역의 지식과 기법들을 융합하여 새로운 관점과 아이디어 그리고 분석을 제시할 수 있습니다. 많은 강화 학습 알고리즘들은 동적 시스템으로 해석 되어질 수 있고 동적 시스템에 대한 기존의 많은 유용... | ||
기대효과 | 강화학습의 이론적 이해를 통해서 더욱 발전된 강화학습 알고리즘을 개발할 수 있습니다. 이를 통해서 로볷과 자동차 자율주행등에 적용 할 수 있습니다. 이를 통해 관련 산업의 발전을 기대 할 수 있습니다. | ||
키워드 | 강화학습, 동적시스템, 기계학습, 최적제어, 수렴성해석 |
단독연구 | 기업 | 대학 | 국공립(연)/출연(연) | 외국연구기관 | 기타 |
---|---|---|---|---|---|
|
연구개발단계 | 기초연구 | 산업기술분류 | |
---|---|---|---|
미래유망신기술(6T) | IT(정보기술) | 기술수명주기 | |
연구수행주체 | 연 | 과학기술표준분류 | 인공물 > 정보/통신 > 정보이론 > 인공지능 |
주력산업분류 | 적용분야 | 지식의 진보(비목적연구) | |
중점과학기술분류 | 과제유형 |
과제수행기관(업) 정보 | 과제수행기관(업)명 | 한국과학기술원 | 사업자등록번호 | |
---|---|---|---|---|
연구책임자 | 소속기관명 | 한국과학기술원 | 사업자등록번호 | |
최종학위 | 박사 | 최종학력전공 | 공학 |
국비 | 75,000,000 | 지방비(현금+현물) | 0 |
---|---|---|---|
비고 |