Deep reinforcement learning
- [강사] 지금까지의 과정에서는 가장 기본적인 형태의 강화학습을 살펴보고, 모든 것이 어떻게 작동하는지, 에이전트가 상태에서 학습하는 방식, 각 동작에 대한 동작 값을 Q-Table에서 어떻게 가르치는지를 이해했습니다. 또한 에이전트가 잘 수행하고 더 나은 조치를 취하려면 제대로 학습하기 위해 많은 조치를 시도해야 한다는 것도 알고 있습니다. 이제 에이전트가 Q-Table에서 추적해야 하는 이 많은 작업을 생각해 보십시오. Q-Table은 얼마나 클까요? 예, 아주, 아주 큽니다. 그리고 이것이 바로 딥 러닝이 등장하는 곳이며, 강화 학습을 보다 효과적으로 만들고 더 큰 정보 공간을 더 쉽게 처리할 수 있도록 합니다. 신경망은 에이전트가 환경에 대해 가지고 있는 정보와 상태에서 취할 수 있는 모든 가능한 조치를 입력으로 취하고, 조치를 취하기 전에 가능한 모든 조치에 대한 보상을 예측합니다. 이렇게 하면 시행착오 단계가 제거되고 Q-Table을 사용한 기본 강화 학습에서 수행되는 것처럼 작업 값을 자주 업데이트할 수 있습니다. 이는 강화 학습의 주요 개선 사항 중 하나이며, AI 개발자 또는 강화 학습을 사용하는 연구원인 경우 배워야 합니다.
Paper:
The Survey of Inverse Reinforcement Learning
역 RL은 어떻게 작동하나요? How does the inverse RL work?
역 강화 학습을 통해 학습하는 에이전트는 다른 에이전트(RL이든 아니든)의 동작을 모방합니다. Agents that learn via inverse reinforcement learning imitate the action of other agents(RL or not).
'딥러닝' 카테고리의 다른 글
Mastering-Image-Segmentation-With-PyTorch-using-Real-World-Projects (0) | 2023.12.25 |
---|---|
LLM (1) | 2023.12.23 |
RFL books (0) | 2023.11.15 |
SCPD stanford online (0) | 2023.11.14 |
quiz 1 (0) | 2023.11.09 |