R&D 정보

과제 상세정보

목록

대규모의 제약이 있는 마코프 의사 결정 과정을 위한 몬테카를로 플래닝 및 학습 알고리즘

작성자

관리자

조회수

64

등록일

2024-05-21

사업 정보
내역사업 글로벌박사펠로우십사업
과제 기본정보
과제명 대규모의 제약이 있는 마코프 의사 결정 과정을 위한 몬테카를로 플래닝 및 학습 알고리즘
과제고유번호 1345318766
부처명 교육부
시행계획 내 사업명
시행계획 내 사업유형 예산출처지역 대전광역시 사업수행지역 대전광역시
계속/신규 과제구분 계속과제 이전연도 과제번호 1345298879
과제수행연도 2020 총연구기간 2018-03-01 ~ 2021-02-28 당해연도 연구기간 2020-03-01 ~ 2021-02-28
요약 정보
연구목표 1. 이산 상태 및 행동 공간을 갖는 순차적 의사 결정 문제- 매우 큰 '단일 목적' 순차적 의사결정 문제를 풀기 위한 방법론은 몬테-카를로 트리 탐색을 포함해 많은 연구가 진척되었으나, 현실의 많은 문제는 '여러 종류의 목적과 제약'으로 이루어져 있어 기존의 방법론들이 그대로 적용될 수 없음. - 다목적 문제를 표현하는, 특히 제약이 있는 이산 마코프 의...
연구내용 1. 이산 상태 및 행동 공간을 갖는 대규모의 제약이 있는 의사결정 문제를 위한 MCTS 플래닝 알고리즘 연구- 매우 큰 Discrete CMDP Planning 문제를 풀기 위한 몬테-카를로 트리탐색 알고리즘 개발- 부분적으로 관찰 가능한 문제 (Constrained Partially Observable Markov Decision process; CPO...
기대효과 - 알파고의 핵심 기술 중 하나인 몬테카를로 트리 탐색을 이용해 매우 큰 CMDP를 풀려는 첫 시도.- Off-policy sample도 함께 이용할 경우 보다 적은 경험만으로도 제약을 만족하는 최적 행동 정책을 찾을 수 있을 것으로 기대되며, 현실 문제의 해결 비용 감소 기대.- 비용 제약이 있는 온라인 광고, 안전성에 대한 제약이 있는 탐사 로봇, 행동...
키워드 제약이 있는 마코프 의사 결정 과정, 몬테-카를로 트리 탐색
위탁/공동여부 정보
단독연구 기업 대학 국공립(연)/출연(연) 외국연구기관 기타
기술 정보
연구개발단계 기초연구 산업기술분류
미래유망신기술(6T) IT(정보기술) 기술수명주기
연구수행주체 과학기술표준분류 인공물 > 전기/전자 > 무기센서 및 제어 > 무인자동화
주력산업분류 적용분야 지식의 진보(비목적연구)
중점과학기술분류 과제유형
과제수행기관(업) 정보
과제수행기관(업) 정보 과제수행기관(업)명 한국과학기술원 사업자등록번호
연구책임자 소속기관명 한국과학기술원 사업자등록번호
최종학위 박사 최종학력전공 공학
사업비
국비 10,750,000 지방비(현금+현물) 0
비고