本文へ
ここから本文です

深層強化学習による運動学習過程におけるシナジー発現プロセスの存在を実証 ー運動学習メカニズムの解明に貢献ー

【発表のポイント】

  • 深層強化学習による運動学習タスクにおいて運動シナジーの発現プロセスが起きていることを初めて定量的に示した。
  • 運動シナジーの発現度合いが運動学習の習熟度と連動しており、特にエネルギーあたりの運動パフォーマンスと高い相関があることを示した。
  • 人間の運動学習プロセスと関連のある運動シナジーが、深層強化学習でも発現していることから、人間や生物の運動学習メカニズムの理解にもつながる。

【概要】

東北大学大学院工学研究科の林部充宏教授とJiazheng Chai大学院生らの研究グループは、深層強化学習※1による運動学習過程において運動シナジー※2の発現プロセスが起きていることを初めて定量的に示しました。深層強化学習アルゴリズムを用いた報酬※3では運動パフォーマンスとエネルギーを考慮しただけで、シナジーについては何も指定していないにもかかわらず、運動習熟レベルが進むほど運動シナジー強度も増大しました。また運動シナジー発現が特にエネルギーあたりの運動パフォーマンスと高い相関があることを示しました。運動学習過程で潜在的に起きている現象との関連性が期待されるため、人間や生物の運動学習メカニズムの理解にもつながると期待されます。

本研究成果は、ロボット分野で最もメジャーな国際会議IEEE ICRA2020のJournal Optionとして採択され、科学雑誌「IEEE Robotics and Automation Letters」に2020年1月22日付けで掲載されました。

図1深層強化学習による歩行タスクを行いながら時空間シナジーを算出する模式図

【用語解説】

注1: 深層強化学習
深層学習(ディープラーニング)とは、生物の神経回路を模擬する多層ニューラルネットワークによる機械学習手法で、深層強化学習は一連の行動を通じて報酬が最も多く得られるような方策を学習する最近注目されているAI計算手法です。

注2: 運動シナジー
運動が時空間的にある一定の組み合わせで協調的に制御されているという考え方で、人間や生物の運動にはこの協調構造が採用されていると考えられています。

注3: 報酬
強化学習の枠組みで用いられる計算指針のようなもので、AIが導いた結果の評価として得られるのが報酬です。

詳細(プレスリリース本文)PDF

問い合わせ先

(研究に関して)
東北大学大学院工学研究科 ロボティクス専攻
教授 林部 充宏
電話 022-795- 6970
E-mail: mitsuhiro.hayashibe.e6*tohoku.ac.jp(*を@に置き換えてください)

(報道に関して)
東北大学工学研究科情報広報室 担当 沼澤 みどり
TEL: 022-795-5898
E-mail: eng-pr*grp.tohoku.ac.jp(*を@に置き換えてください)

このページの先頭へ