R&D 정보

과제 상세정보

목록

부가정보를 활용한 데이터 효율적 강화학습 연구

작성자

관리자

조회수

55

등록일

2024-05-21

사업 정보
내역사업 (유형1-1)중견연구
과제 기본정보
과제명 부가정보를 활용한 데이터 효율적 강화학습 연구
과제고유번호 1711112824
부처명 과학기술정보통신부
시행계획 내 사업명
시행계획 내 사업유형 예산출처지역 대전광역시 사업수행지역 대전광역시
계속/신규 과제구분 계속과제 이전연도 과제번호 1711098615
과제수행연도 2020 총연구기간 2019-09-01 ~ 2024-02-29 당해연도 연구기간 2020-03-01 ~ 2021-02-28
요약 정보
연구목표 산업계에 존재하는 시스템들의 복잡도 (complexity) 는 시간이 지남에 따라 증가하고 있으며 이러한 시스템들을 모델링하는 비용 또한 증가하게 됨에 따라, 기존 비선형 모델기반 제어방법론들의 적용 또한 어려워지고 있음.강화학습은 전통적 모델기반 방법들과 비교하였을 때 해당 시스템에 대한 전문가 지식 (domain knowledge) 을 적게 요구하기 때...
연구내용 1년차 목표: 전문가 혹은 비전문가의 시연 데이터를 활용하여 강화학습(reinforcement learning; RL) 에이전트(agent)의 학습효율을 향상하는 알고리즘 연구.본 연구에서는 전문가 혹은 비전문가의 시연데이터 (expert trajectories) 를 부가정보 (side information) 로 활용하여 강화학습 에이전트의 학습효율을 증진...
기대효과 본 연구진이 제안하는 부가정보인 불완전한 전문가데이터, 멀티태스크 학습정보는 현 산업계의 조업상황 (operating condition) 을 고려해봤을 때 현실적으로 어렵지 않게 습득 가능한 정보들로써 이를 순수 데이터 기반 강화학습 알고리즘에 통합 시 획기적인 학습 효율 개선을 달성할 수 있을 것으로 기대함. -조업상황의 현실성을 반영한 불완전 전문가 데...
키워드 강화학습,다중태스크 학습,데이터 기반 제어 기법,불완전 전문가 데이터 활용,메타 학습 방법론,부가정보를 활용
위탁/공동여부 정보
단독연구 기업 대학 국공립(연)/출연(연) 외국연구기관 기타
기술 정보
연구개발단계 기초연구 산업기술분류
미래유망신기술(6T) IT(정보기술) 기술수명주기
연구수행주체 과학기술표준분류 인공물 > 정보/통신 > 정보이론 > 인공지능
주력산업분류 적용분야 전문, 과학 및 기술서비스업
중점과학기술분류 과제유형
과제수행기관(업) 정보
과제수행기관(업) 정보 과제수행기관(업)명 한국과학기술원 사업자등록번호
연구책임자 소속기관명 한국과학기술원 사업자등록번호
최종학위 박사 최종학력전공 공학
사업비
국비 100,000,000 지방비(현금+현물) 0
비고