電子情報通信学会総合大会講演要旨
D-8-7
ランキング学習を用いたサッカーエージェントの意思決定における評価関数の学習
○辻 将司・秋山英久・荒牧重登(福岡大)
 RoboCupサッカーシミュレーションにおいて行動連鎖探索フレームワークを用いたオンライン協調行動プランニングが提案されている.しかしながら,フレームワークで用いる評価関数の設計において,従来は人手でのパラメータ調整が行われており,適切な評価関数の獲得にかかるコストが大きかった.本研究ではランキング学習手法を用いることで,低い作業コストでの評価関数の獲得を目指す.実験として学習前後でのランキングの順位の変化を観察する.