R&D 정보

과제 상세정보

목록

일반화된 환경에 적합한 정보이론 기반 강화학습 알고리즘 개발

작성자

관리자

조회수

42

등록일

2024-05-22

사업 정보
내역사업 (유형1-2)중견연구
과제 기본정보
과제명 일반화된 환경에 적합한 정보이론 기반 강화학습 알고리즘 개발
과제고유번호 1711130276
부처명 과학기술정보통신부
시행계획 내 사업명
시행계획 내 사업유형 예산출처지역 대전광역시 사업수행지역 대전광역시
계속/신규 과제구분 신규과제
과제수행연도 2021 총연구기간 2021-03-01 ~ 2025-02-28 당해연도 연구기간 2021-03-01 ~ 2022-02-28
요약 정보
연구목표 본 연구에서는 인공지능의 핵심 분야 중 하나인 강화학습 분야에서 최적 정책을 학습한 환경과 다른 일반화된 환경에 대해서도 최적 성능을 유지하는 정보이론 기반의 강화학습 알고리즘 개발을 목표로 한다. 정책을 학습하는 환경과 이를 적용하는 일반화된 실제 환경이 상이할수록 학습된 정책의 성능이 현저히 낮아지며, 환경의 변화에 강인한 정책의 학습이 어려워진다. 이...
연구내용 본 연구는 강화학습을 궁극적으로 적용할 실제 환경에서 성공적으로 적용하기 위하여 다양한 환경 변화에 강인한 정책 학습 알고리즘을 개발하며, 학습 환경으로부터의 변화 정도 및 특성에 따라 연차별로 나눠 진행한다. 1차 연도에는 input noise에 강인한 정책을 학습하는 강화학습 알고리즘을 연구한다. 이를 위하여 강화학습 알고리즘의 noise 민감도 분석하...
기대효과 본 연구를 진행함으로써 다음 세 가지 측면을 기대할 수 있다. 첫째는 인공지능 핵심 원천 기술의 확보이다. 구글 딥마인드, 페이스북 등 많은 글로벌 기업들은 강화학습을 빠르게 연구하고, 이를 산업에 적용하는 반면, 국내에서는 아직 많은 연구가 진행되지 않았다. 따라서 본 과제를 진행함으로써 이러한 기술 격차를 줄이고 뛰어난 인공지능 핵심 원천 기술을 확보할...
키워드 강화학습,정보이론,일반화된 강화학습
위탁/공동여부 정보
단독연구 기업 대학 국공립(연)/출연(연) 외국연구기관 기타
기술 정보
연구개발단계 기초연구 산업기술분류
미래유망신기술(6T) IT(정보기술) 기술수명주기
연구수행주체 과학기술표준분류 인공물 > 정보/통신 > 정보이론 > 인공지능
주력산업분류 적용분야 제조업(전기 및 기계장비)
중점과학기술분류 과제유형
과제수행기관(업) 정보
과제수행기관(업) 정보 과제수행기관(업)명 한국과학기술원 사업자등록번호
연구책임자 소속기관명 한국과학기술원 사업자등록번호
최종학위 박사 최종학력전공 공학
사업비
국비 203,121,000 지방비(현금+현물) 0
비고