강화학습 Archives < 도리의 디지털라이프

강화학습

7년 ago

I. 분류와 예측 모형, 인공신경망, ANN 가. 인공신경망의 개념 인간의 뉴런을 모방하여 가중치 조정을 통한 분류와 예측을 위해 다수 노드를…

7년 ago

I. 강화 학습 기법, Q-러닝(Q-Learning) 특정 상태에서 행동에 대한 미래값(Q)을 계산하여, 최적 정책을 찾는 마르코프 의사결정 기반 강화학습 기법 마르코프…

7년 ago

1. 최적 Policy 수립, 마르코프 결정 프로세스(MDP) 마르코프 결정 프로세스, MDP (Markov Decision Process) 개념 필요성 이산시간 확률제어 과정으로, 상태,…

7년 ago

1. 인간의 학습 과정 모방, 기계 학습 개념 대량의 데이터를 지도/비지도, 강화 학습 등을 통해 문제의 해답을 찾아내는 기법 지도…

7년 ago

1. 알파고의 학습 방법, 강화학습 (1) 강화학습(Reinforcement Learning)의 개념 데이터의 상태를 인식하여 행위 기반 환경으로 받는 보상을 학습하여 최적화 정책…