R&D 정보

과제 상세정보

목록

정보기하학을 이용한 거대 행동공간 강화학습 성능향상을 위한 연구

작성자

관리자

조회수

58

등록일

2024-05-21

사업 정보
내역사업 전략과제(산업수학)
과제 기본정보
과제명 정보기하학을 이용한 거대 행동공간 강화학습 성능향상을 위한 연구
과제고유번호 1711109303
부처명 과학기술정보통신부
시행계획 내 사업명
시행계획 내 사업유형 예산출처지역 대전광역시 사업수행지역 대전광역시
계속/신규 과제구분 계속과제 이전연도 과제번호 1711083148
과제수행연도 2020 총연구기간 2017-09-01 ~ 2021-08-31 당해연도 연구기간 2020-03-01 ~ 2021-02-28
요약 정보
연구목표 본 연구에서는 인공지능에서 핵심 분야 중의 하나인 강화학습(reinforcement learning) 분야에서 행동공간이 연속적일 때 가치함수을 통하지 않고 최적 정책을 바로 찾는 직접 정책 탐색의 근간을 이루는 확률적 정책 경사 하강 방식(policy gradient method)에 정보이론와 통계학와 리만기하학의 융합 수학 분야인 정보기하학(inform...
연구내용 1차년도(2017. 9 – 2018. 8): 안정적 정책 수렴을 위한 거대 공간 강화학습의 확률적 최적화 모델 제시 ○ 정책 수렴 안정성 증가를 위한 목적 함수 최적화 제한 조건 연구○ 확률적 목적 함수 추정 방법과 안정적 정책 수렴의 연관성 분석2차년도(2018. 9 – 2019. 8): 거대 공간에서 편향/분산 분석을 통한 최적의 정책 학습 방법 제시○...
기대효과 ■ 현실적인 문제를 해결하기 위한 강화학습 기술 확보 및 기술의 산업화에 기여 본 연구는 강화학습이 실시간으로 제어하는 다양한 문제를 해결할 수 있게 함으로써, 아직 연구 및 적용에만 머물러 있는 인공지능 기술을 산업화 할 수 있도록 한다. 4차 산업혁명 시대에 맞는 인공지능의 새로운 산업화 모델을 통해 우리나라의 미래 먹거리를 찾을 수 있을 것이다. ■...
키워드 강화학습,정책탐색,정책 경사 하강법,정보기하학,매개변수 통계학,거대 행동 공간,수렴 안정성,고속 수렴성
위탁/공동여부 정보
단독연구 기업 대학 국공립(연)/출연(연) 외국연구기관 기타
기술 정보
연구개발단계 기초연구 산업기술분류
미래유망신기술(6T) IT(정보기술) 기술수명주기
연구수행주체 과학기술표준분류 인공물 > 정보/통신 > 정보이론 > 인공지능
주력산업분류 적용분야 지식의 진보(비목적연구)
중점과학기술분류 과제유형
과제수행기관(업) 정보
과제수행기관(업) 정보 과제수행기관(업)명 한국과학기술원 사업자등록번호
연구책임자 소속기관명 한국과학기술원 사업자등록번호
최종학위 박사 최종학력전공 공학
사업비
국비 100,000,000 지방비(현금+현물) 0
비고