本文へ
ここから本文です

量子インスパイアード技術を用いた大量データのクラスタリング手法の開発 多様な分野における画像を含む時系列データの分析に利用

【本学研究者情報】

〇流体科学研究所 教授 永井大樹
流体科学研究所 助教 伊神翼
研究室ウェブサイト

【発表のポイント】

  • 科学、工学、環境、農業、生命科学、経済学をはじめ多くの分野で、時間とともに変化するデータ(時系列データ)を大量に収集し、類似度に応じて適切にグループ分け(クラスタリング)し、特徴的な挙動を解析することが重要となっています。
  • 本研究では、時系列データのクラスタリングを組合せ最適化問題として捉え、この問題に特化した量子インスパイアード技術を適用することで、大量なデータのクラスタリングを高速に行うことに成功しました。

【概要】

早稲田大学理工学術院教授 松田佑(まつだゆう)、同大学院生 井上智輝(いのうえともき)、窪田航陽(くぼたこうよう)、東北大学流体科学研究所教授 永井大樹(ながいひろき)、同助教 伊神翼(いかみつばさ)、愛知工業大学工学部教授 江上泰広(えがみやすひろ)らの研究グループ(以下、「本研究グループ」とする)は、大きなサイズで大量の時系列データ*1のクラスタリング*2を組合せ最適化問題*3として捉え、これに特化した計算技術を応用して高速な計算を可能としました。また、どのクラスタにも相応しくない外れ値を、クラスタに含まないようなアルゴリズム構築を行いました。これにより、多分野での画像を含む時系列データの解析に本手法が貢献できると期待されます。

このたびの成果は、英国の科学雑誌Natureが運営するオープンアクセスジャーナル『Communications Engineering』に、"Clustering Method for Time-Series Images Using Quantum-Inspired Digital Annealer Technology"として、2024110(現地時間)に掲載されました。

図1 本研究による高精度クラスタリング結果

【用語解説】

※1 時系列データ
時間と共に変化する量についてのデータ。例えば、気温の時間変化、株価や為替相場など。

※2 クラスタリング
データを類似度に応じてグループ分けすること。教師なしの機械学習のひとつ。教師あり学習である「分類」とは異なる。作られたグループはクラスタと呼ばれる。また類似度とは2つのデータがお互いにどれだけ似ているのかを示す指標。

※3 組合せ最適化問題
考えられる組合せの中から、与えられた条件を満たす最適な組合せを選ぶ問題。巡回セールスマン問題やナップサック問題などがよく知られている。

詳細(プレスリリース本文)PDF

問い合わせ先

(研究に関すること)
東北大学流体科学研究所
教授 永井 大樹(ながい ひろき)
TEL: 022-217-5227
E-mail: nagai.hiroki*tohoku.ac.jp(*を@に置き換えてください)

(報道に関すること)
東北大学流体科学研究所 広報戦略室
Tel: 022-217-5873 
E-mail: ifs-koho*grp.tohoku.ac.jp(*を@に置き換えてください)

sdgs_logo

sdgs04sdgs07 sdgs09

東北大学は持続可能な開発目標(SDGs)を支援しています

このページの先頭へ