관리자
35
2024-05-22
내역사업 | (유형1-1)중견연구 |
---|
과제명 | 부가정보를 활용한 데이터 효율적 강화학습 연구 | ||||
---|---|---|---|---|---|
과제고유번호 | 1711145020 | ||||
부처명 | 과학기술정보통신부 | ||||
시행계획 내 사업명 | |||||
시행계획 내 사업유형 | 예산출처지역 | 대전광역시 | 사업수행지역 | 대전광역시 | |
계속/신규 과제구분 | 신규과제 | ||||
과제수행연도 | 2021 | 총연구기간 | 2019-09-01 ~ 2024-02-29 | 당해연도 연구기간 | 2021-03-01 ~ 2022-02-28 |
연구목표 | 산업계에 존재하는 시스템들의 복잡도 (complexity) 는 시간이 지남에 따라 증가하고 있으며 이러한 시스템들을 모델링하는 비용 또한 증가하게 됨에 따라, 기존 비선형 모델기반 제어방법론들의 적용 또한 어려워지고 있음.강화학습은 전통적 모델기반 방법들과 비교하였을 때 해당 시스템에 대한 전문가 지식 (domain knowledge) 을 적게 요구하기 때... | ||
---|---|---|---|
연구내용 | 1년차 목표: 전문가 혹은 비전문가의 시연 데이터를 활용하여 강화학습(reinforcement learning; RL) 에이전트(agent)의 학습효율을 향상하는 알고리즘 연구.본 연구에서는 전문가 혹은 비전문가의 시연데이터 (expert trajectories) 를 부가정보 (side information) 로 활용하여 강화학습 에이전트의 학습효율을 증진... | ||
기대효과 | 본 연구진이 제안하는 부가정보인 불완전한 전문가데이터, 멀티태스크 학습정보는 현 산업계의 조업상황 (operating condition) 을 고려해봤을 때 현실적으로 어렵지 않게 습득 가능한 정보들로써 이를 순수 데이터 기반 강화학습 알고리즘에 통합 시 획기적인 학습 효율 개선을 달성할 수 있을 것으로 기대함. -조업상황의 현실성을 반영한 불완전 전문가 데... | ||
키워드 | 강화학습,다중태스크 학습,데이터 기반 제어 기법,불완전 전문가 데이터 활용,메타 학습 방법론,부가정보를 활용 |
단독연구 | 기업 | 대학 | 국공립(연)/출연(연) | 외국연구기관 | 기타 |
---|---|---|---|---|---|
|
연구개발단계 | 기초연구 | 산업기술분류 | |
---|---|---|---|
미래유망신기술(6T) | IT(정보기술) | 기술수명주기 | |
연구수행주체 | 학 | 과학기술표준분류 | 인공물 > 정보/통신 > 정보이론 > 인공지능 |
주력산업분류 | 적용분야 | 전문, 과학 및 기술서비스업 | |
중점과학기술분류 | 과제유형 |
과제수행기관(업) 정보 | 과제수행기관(업)명 | 한국과학기술원 | 사업자등록번호 | |
---|---|---|---|---|
연구책임자 | 소속기관명 | 한국과학기술원 | 사업자등록번호 | |
최종학위 | 박사 | 최종학력전공 | 공학 |
국비 | 100,000,000 | 지방비(현금+현물) | 0 |
---|---|---|---|
비고 |