RF

Deep reinforcement learning

- [강사] 지금까지의 과정에서는 가장 기본적인 형태의 강화학습을 살펴보고, 모든 것이 어떻게 작동하는지, 에이전트가 상태에서 학습하는 방식, 각 동작에 대한 동작 값을 Q-Table에서 어떻게 가르치는지를 이해했습니다. 또한 에이전트가 잘 수행하고 더 나은 조치를 취하려면 제대로 학습하기 위해 많은 조치를 시도해야 한다는 것도 알고 있습니다. 이제 에이전트가 Q-Table에서 추적해야 하는 이 많은 작업을 생각해 보십시오. Q-Table은 얼마나 클까요? 예, 아주, 아주 큽니다. 그리고 이것이 바로 딥 러닝이 등장하는 곳이며, 강화 학습을 보다 효과적으로 만들고 더 큰 정보 공간을 더 쉽게 처리할 수 있도록 합니다. 신경망은 에이전트가 환경에 대해 가지고 있는 정보와 상태에서 취할 수 있는 모든 가능한 조치를 입력으로 취하고, 조치를 취하기 전에 가능한 모든 조치에 대한 보상을 예측합니다. 이렇게 하면 시행착오 단계가 제거되고 Q-Table을 사용한 기본 강화 학습에서 수행되는 것처럼 작업 값을 자주 업데이트할 수 있습니다. 이는 강화 학습의 주요 개선 사항 중 하나이며, AI 개발자 또는 강화 학습을 사용하는 연구원인 경우 배워야 합니다.

Paper:

The Survey of Inverse Reinforcement Learning

역 RL은 어떻게 작동하나요? How does the inverse RL work?
역 강화 학습을 통해 학습하는 에이전트는 다른 에이전트(RL이든 아니든)의 동작을 모방합니다. Agents that learn via inverse reinforcement learning imitate the action of other agents(RL or not).

저작자표시 비영리 변경금지

'딥러닝' 카테고리의 다른 글

Mastering-Image-Segmentation-With-PyTorch-using-Real-World-Projects (0)	2023.12.25
LLM (1)	2023.12.23
RFL books (0)	2023.11.15
SCPD stanford online (0)	2023.11.14
quiz 1 (0)	2023.11.09

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

development note

RF

'딥러닝' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

RF

'딥러닝' 카테고리의 다른 글

'딥러닝' Related Articles

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역