進化型ニューラルネットによるマルチエージェント強化学習手法
【研究分野】知能情報学
【研究キーワード】
マルチエージェントシステム / マルチエージェント強化学習 / マルチエージェント学習 / 強化学習 / 進化計算 / 共進化 / ニューラルネット / 創発システム
【研究成果の概要】
本研究の代表者らが提案している進化型ニューラルネットに基づくマルチエージェント強化学習手法は,マルチエージェント強化学習を行う上で問題となる行動政策空間の爆発に対応可能なだけでなく,(i)連続および離散値の入出力への対応,(ii)連続および離散時間への対応ならびに(iii)大域的に良好な行動政策の獲得などの可能性を有しており,マルチエージェント強化学習手法の基本的枠組みとして有望である.
本研究ではまず,比較的小規模ではあるが,従来のマルチエージェント強化学習手法では設計困難なクラスのマルチエージェントシステムをとりあげ,それらの設計問題への適用を通して,進化型ニューラルネットおよびその発展版である共進化型ニューラルネットに基づくマルチエージェント強化学習手法の有効性を確認した.
しかしながら,進化/共進化型ニューラルネット手法によるシステムの設計には膨大な計算論的コストが要求され,大規模かつ複雑なマルチエージェントシステムの設計問題に対して,同手法をそのまま適用することは現実的とはいえない.
そこで本研究では,マルチエージェントシステム全体のタスクを階層的なサブタスクに分解し,進化/共進化型ニューラルネットに基づき,それらを段階的に設計することに基礎をおくマルチエージェントシステムの段階的設計法を提案し,その有効性を確認した.
ここでは特にRoboCupサッカーチームの設計問題をとりあげ,それを(i)サッカーエージェントの基本タスク,(ii)基本タスク間の相互作用および(iii)エージェント間の連携タスクの設計問題に分解すると共に,進化/共進化型ニューラルネットに基づき,それらを段階的に設計することによって,大規模かつ複雑なマルチエージェントシステムが効果的に設計可能であることを実験的に明らかにした.
【研究代表者】
【研究分担者】 |
小野 功 | 徳島大学 | 工学部 | 助教授 | (Kakenデータベース) |
|
【研究種目】基盤研究(C)
【研究期間】2002 - 2003
【配分額】3,600千円 (直接経費: 3,600千円)