3P-06
複利型教科学習における投資比率学習法の改善
○羽根田拓哉,松井藤五郎(中部大)
本論文では、複利型強化学習における投資比率の学習法を改善する。従来手法の投資比率最適化付き複利型Q学習では、オンライン勾配法を用いて獲得したリターンから投資比率fを学習する。この方法では、投資比率fが0以下になると学習の結果のリセットを行い、fをランダムな値、もしくは初期の設定値として再度学習を始めるので、学習が始めからとなってしまう。そこで本論文では、投資比率fの学習方法を改善し、リセットしないでfを学習する方法を提案する。また、実験により提案手法の有効性を示す。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会