[태그:] 최적 의사결정

마르코프 결정 프로세스 (MDP, Markov Decision Process)

1. 최적 Policy 수립, 마르코프 결정 프로세스(MDP) 마르코프 결정 프로세스, MDP (Markov Decision Process) 개념 필요성 이산시간 확률제어 과정으로, 상태, 행동 및 전이확률 기반 최적의 의사결정 정책 을 탐색하는 강화학습 기법 – 인공지능 판단 정책 필요 – 최적 의사결정 탐색 – AI 자율적 학습 필요 – 최적화 문제 도구로 활용 2. 마르코프 결정 프로세스의

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31