티스토리 뷰

딥러닝

RF

shannon. 2023. 11. 23. 13:12
반응형

Deep reinforcement learning

- [강사] 지금까지의 과정에서는 가장 기본적인 형태의 강화학습을 살펴보고, 모든 것이 어떻게 작동하는지, 에이전트가 상태에서 학습하는 방식, 각 동작에 대한 동작 값을 Q-Table에서 어떻게 가르치는지를 이해했습니다. 또한 에이전트가 잘 수행하고 더 나은 조치를 취하려면 제대로 학습하기 위해 많은 조치를 시도해야 한다는 것도 알고 있습니다. 이제 에이전트가 Q-Table에서 추적해야 하는 이 많은 작업을 생각해 보십시오. Q-Table은 얼마나 클까요? 예, 아주, 아주 큽니다. 그리고 이것이 바로 딥 러닝이 등장하는 곳이며, 강화 학습을 보다 효과적으로 만들고 더 큰 정보 공간을 더 쉽게 처리할 수 있도록 합니다. 신경망은 에이전트가 환경에 대해 가지고 있는 정보와 상태에서 취할 수 있는 모든 가능한 조치를 입력으로 취하고, 조치를 취하기 전에 가능한 모든 조치에 대한 보상을 예측합니다. 이렇게 하면 시행착오 단계가 제거되고 Q-Table을 사용한 기본 강화 학습에서 수행되는 것처럼 작업 값을 자주 업데이트할 수 있습니다. 이는 강화 학습의 주요 개선 사항 중 하나이며, AI 개발자 또는 강화 학습을 사용하는 연구원인 경우 배워야 합니다.

Paper:

The Survey of Inverse Reinforcement Learning

역 RL은 어떻게 작동하나요? How does the inverse RL work?
역 강화 학습을 통해 학습하는 에이전트는 다른 에이전트(RL이든 아니든)의 동작을 모방합니다. Agents that learn via inverse reinforcement learning imitate the action of other agents(RL or not).

반응형

'딥러닝' 카테고리의 다른 글

Mastering-Image-Segmentation-With-PyTorch-using-Real-World-Projects  (0) 2023.12.25
LLM  (1) 2023.12.23
RFL books  (0) 2023.11.15
SCPD stanford online  (0) 2023.11.14
quiz 1  (0) 2023.11.09
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/07   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31
글 보관함