| 연구목표 |
산업계에 존재하는 시스템들의 복잡도 (complexity) 는 시간이 지남에 따라 증가하고 있으며 이러한 시스템들을 모델링하는 비용 또한 증가하게 됨에 따라, 기존 비선형 모델기반 제어방법론들의 적용 또한 어려워지고 있음.강화학습은 전통적 모델기반 방법들과 비교하였을 때 해당 시스템에 대한 전문가 지식 (domain knowledge) 을 적게 요구하기 때... |
| 연구내용 |
1년차 목표: 전문가 혹은 비전문가의 시연 데이터를 활용하여 강화학습(reinforcement learning; RL) 에이전트(agent)의 학습효율을 향상하는 알고리즘 연구.본 연구에서는 전문가 혹은 비전문가의 시연데이터 (expert trajectories) 를 부가정보 (side information) 로 활용하여 강화학습 에이전트의 학습효율을 증진... |
| 기대효과 |
본 연구진이 제안하는 부가정보인 불완전한 전문가데이터, 멀티태스크 학습정보는 현 산업계의 조업상황 (operating condition) 을 고려해봤을 때 현실적으로 어렵지 않게 습득 가능한 정보들로써 이를 순수 데이터 기반 강화학습 알고리즘에 통합 시 획기적인 학습 효율 개선을 달성할 수 있을 것으로 기대함. -조업상황의 현실성을 반영한 불완전 전문가 데... |
| 키워드 |
강화학습,다중태스크 학습,데이터 기반 제어 기법,불완전 전문가 데이터 활용,메타 학습 방법론,부가정보를 활용 |