반응형 [강화학습] 강화학습 커리큘럼 강화학습 (Reinforcement Learning) 강의 계획안강의 목표강화학습의 기본 개념과 원리 이해주요 강화학습 알고리즘 학습강화학습을 사용하여 실제 문제 해결 경험강의 기간: 12주 (주 1회, 회당 2시간) 강의 일정 및 내용주차주제내용실습/과제1주차강화학습 개요강화학습의 기본 개념 및 응용 분야강화학습 개념 요약2주차MDP와 기본 원리마코프 결정 과정(MDP)와 기본 원리 이해MDP 모델링 실습3주차가치 함수와 벨만 방정식가치 함수, 벨만 방정식 및 최적 정책벨만 방정식 구현4주차동적 프로그래밍정책 반복, 가치 반복정책 반복 및 가치 반복 구현5주차몬테카를로 방법몬테카를로 예측, 제어 방법몬테카를로 방법 실습6주차시간차 학습TD(0), Sarsa, Q-learningTD 학습 알고리즘 구현7.. 2024. 6. 5. 이전 1 다음 반응형