|
Q学習(-がくしゅう、)は、機械学習分野における強化学習の一種である。 == 概要 == Q学習は機械学習手法の方策オフ型TD学習の一つである。概念自体は古くから存在するが、Q学習()という名前で今日の手法がまとめられたのは、1989年のクリス・ワトキンズ()の論文に端を発する。 Q学習は有限マルコフ決定過程において全ての状態が十分にサンプリングできるようなエピソードを無限回試行した場合、最適な評価値に収束することが理論的に証明されている。実際の問題に対してこの条件を満たすことは困難ではあるが、この証明はQ学習の有効性を示す要素の一つとして挙げられる。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「Q学習」の詳細全文を読む スポンサード リンク
|