| 연구목표 |
본 연구에서는, 강력한 표현력을 지닌 자동회기(Auto-regressive) 이미지 디코더의 사용이 사물중심 표현과 같은 은닉표현의 학습을 어렵게 할 수 있다는 기존의 관점과는 달리, 강력한 표현력을 가진 트랜스포머 기반의 이미지 디코더를 사물중심 표현학습 모델에 적용했을 때 고품질이면서 체계적 일반화가 가능한 이미지 생성과 표현학습이 가능하다는 연구가설을... |
| 연구내용 |
본 연구자는 선행적 탐색 실험을 통해 강력한 트랜스포머-기반 이미지 디코더를 사용하지만 전체적으로 간결한 구조를 갖는 비지도 사물중심 표현학습 모델을 시험한 결과, 기존의 관점과 달리 강력한 이미지 디코더를 갖춘 모델이 고품질의 이미지 복원을 가능하게 하며, 동시에 사물중심 표현의 자연발생 성능도 향상시킬 수 있다는 가능성을 확인하였다. 이에 따라, 첫째로... |
| 기대효과 |
사물중심의 구조적 표현은 언어, 수학, 인과관계 및 계획 등의 고수준의 추론과 일반화를 요하는 고급 지능을 구현하는데 활용될 수 있다. 또한, 사물중심 표현의 조합가능성을 지원한다는 장점을 활용하여 효율적인 Few-Shot 또는 Zero-Shot 월드모델을 학습하고 추론하는 모델의 기반이 될 수 있으며, 모델기반 강화학습의 샘플 효율성을 개선하는데도 중요한... |
| 키워드 |
표현학습,사물중심학습,비지도 학습,조합성,체계적 일반화,월드모델 |