本文へ
ここから本文です

スーパーコンピュータ「富岳」政策対応枠における大規模言語モデル分散並列学習手法の開発について

【本学研究者情報】

〇大学院情報科学研究科 准教授 坂口慶祐
大学院情報科学研究科 教授 乾健太郎
研究室ウェブサイト

【概要】

国立大学法人東京工業大学(注1)(以下、東京工業大学)、国立大学法人東北大学(注2)(以下、東北大学)、富士通株式会社(注3)(以下、富士通)、国立研究開発法人理化学研究所(注4)(以下、理化学研究所)は、「富岳」政策対応枠において、スーパーコンピュータ「富岳」を活用した大規模言語モデル(Large Language Model, LLM)(注5)の分散並列学習手法の研究開発を2023年5月から実施します。

【用語解説】

(1)東京工業大学:本学 東京都目黒区 学長 益 一哉。
(2)東北大学:本校 仙台市青葉区 総長 大野 英男。
(3)富士通株式会社:本社 東京都港区、代表取締役社長 時田 隆仁。
(4)理化学研究所:本部 埼玉県和光市、理事長 五神 真。
(5)大規模言語モデル:数億~数十億のパラメータを持ち、大量のデータを用いて事前学習されたニューラルネットワークのことを指す。最近では言語処理におけるGPTや画像処理におけるViTなどが代表的な大規模学習モデルとして知られている。

詳細(プレスリリース本文)PDF

問い合わせ先

(研究に関すること)
東北大学大学院情報科学研究科
坂口 慶祐 准教授
TEL: 022-795-7091
E-mail:keisuke.sakaguchi*tohoku.ac.jp
(*を@に置き換えてください)

(報道に関すること)
東北大学大学院 情報科学研究科 広報室
E-mail: koho*is.tohoku.ac.jp
(*を@に置き換えてください)

sdgs_logo

sdgs09

東北大学は持続可能な開発目標(SDGs)を支援しています

このページの先頭へ