導入事例

2024.05.31

航空宇宙生産技術開発センター様

AIサーバ「NVIDIA DGX H100」を導入いただきました。

岐阜大学工学部 電気電子・情報工学科 情報コース 人工知能研究推進センター センター長 加藤邦人教授(左)と航空宇宙生産技術開発センター センター長 酒井昭仁様(右)にお話を伺いました。

国内初の「生産技術」にフォーカスした教育研究機関

航空宇宙生産技術開発センターは、内閣府交付金と岐阜県補助金の支援を受けて、2019年4月に発足した国内初の「生産技術」にフォーカスした教育研究機関です。2020年10月に岐阜大学内にセンター建屋が完成し、2021年4月にセンター開所式典が行われました。航空宇宙生産技術開発センターが発足した経緯について、センター長の酒井昭仁様は次のように説明しました。「生産技術とは、工業製品を作るときに、設計する工程(計画)とそれに従って実際にモノを作り出す工程(生産)を繋ぎ、いかに高品質かつ低コストで、効率的に生産するかという方法を設計する技術です。あまり知られていませんが、岐阜県や愛知県にはボーイングなどの航空機のボディや細かな部品を作っているメーカーが数多く存在します。こうした日本のメーカーがなければボーイング社も航空機を作ることができないのです。そこで、実際の生産現場に近いところで航空宇宙関連の生産技術を研究し、より競争力を高めるために、航空宇宙生産技術開発センターが作られることになりました」

事業内容

  • ロボットやAI/IoTによる生産効率向上に関する研究
  • 学生および就労者を対象に生産技術を体系的に学ぶ講座を開講

航空宇宙生産技術開発センター

https://ipteca.gifu-u.ac.jp/

航空宇宙生産技術開発センターでは、研究開発と人材育成を柱として活動を行っています。

岐阜大学工学部 電気電子・情報工学科 情報コース
加藤研究室

http://www.cv.info.gifu-u.ac.jp

NVIDIA DGX H100がマルチモーダルによる超汎用検査AIの開発を加速

岐阜大学工学部 電気電子・情報工学科 情報コースの加藤邦人先生は、同センターにおけるAI開発のリーダーとして、コンピュータービジョンを活用した検査AIなどの開発に取り組んできました。

加藤先生から貴重なお時間をいただき、加藤先生が目指しているものや今回導入したシステムをどのように活用しているのか、質問をさせていただきました。

加藤先生が開発に取り組んでいる超汎用検査AIについて教えてください。
これまで、画像から製品の良品、不良品を判断する検査AIは、数多くの良品画像と不良品画像を用意し、ディープラーニングを用いて学習させることで良品と不良品を見分けるといった手法が一般的でした。しかし、この方法には汎用性が低く検査対象物ごとにモデルの学習を行わねばならないという欠点があります。例えば、皿の良品不良品を学習させたモデルで、コップの良品不良品を判断することはできません。人間は、一度割れや欠け、変色などの不良と判断すべき事象を学習すれば、他の対象物に対してもその知識を活かすことができます。私は、そうした人間のように汎用性の高い検査AIを作ることを目指してきました。

加藤先生は、2023年にこれまでの研究を全て中止し、新たに研究を開始したそうですが、そのきっかけは何でしょうか?
2022年頃から盛り上がってきたマルチモーダルAIに大きな衝撃を受けました。マルチモーダルAIとは、テキスト、音声、画像、動画、センサ情報など、2つ以上の異なるモダリティ(データの種類)の情報を統合して処理するAIです。単一のモダリティしか扱えない従来のシングルモーダルAIではできなかったさまざまなタスクが可能になります。これまで私は画像だけを扱ってきました。画像だけで、画像認識をさせようとしていたのですが、そこに突然言語が加わったのです。言語が加わると、クラスラベルという概念がそもそもなくなり、言語によって概念を覚えるわけです。この1年で私の研究内容がガラッと変わり、今までやってきたことを全てやめて、新しくマルチモーダルAIに取り組むことにしました。

マルチモーダルAIの開発において、問題になったことは何でしょうか?
私は、マルチモーダルな大規模視覚言語モデル(LVLM)に対して、割れや欠けといった欠陥の検査基準をいくつか例示して学習させることで、汎用的に検査が行えるAIを作れるのではないかと考えました。私の研究室では、以前からAI開発のためにNVIDIA A100やNVIDIA RTX 6000 AdaといったNVIDIA製GPUを多数利用していましたが、マルチモーダルAIの学習には、非常に高い演算性能と多量のGPUメモリが必要になります。当初NVIDIA V100を32基搭載したクラスターを使って学習させようと思っていたのですが、V100だとGPUメモリが32GBしかないため、LVLMの基盤モデルを学習させるにはメモリが足りないのです。そこで、より高い演算性能と大容量のGPUメモリを得るために、「NVIDIA DGX H100」の導入を決定したのです。
NVIDIA DGX H100の導入によって、マルチモーダルAIの学習速度はどれくらい向上しましたか?
NVIDIA DGX H100では1つのGPUあたり80GBのメモリが使えますので、V100では扱えなかった大規模な基盤モデルも学習できるようになりました。ストレージなどの性能も向上していますので、トータルの学習速度はNVIDIA A100を4基使っていた頃と比べて4,5倍になりました。それでも基盤モデルの学習には5日間かかりますが、NVIDIA DGX H100がなければ研究がここまで進むことはなかったと思います。

NVIDIA DGX H100はサーバルームに設置されているのでしょうか。
本センターの建屋を建てる際に、サーバルームを確保しました。電源もしっかり確保していますが、NVIDIA DGX H100は消費電力も大きいので、もうあまり電源に余裕はありません。

NVIDIA DGXH100の導入の際に、何か苦労した点はありましたでしょうか?
導入そのものはとてもスムーズでした。HPCテックさんの対応もとてもよく、納期やサポート面についても満足しています。HPCテックさんは技術力も高く、安心して導入を任せることができました。

今後の展望を教えてください。
NVIDIA DGX H100の導入によって、超汎用検査AIの開発速度は大きく向上しました。すでに一般知識は豊富だが、外観検査に関する専門知識は乏しいLVLMに対して、外観検査の基準を例示して学習させることで汎用的な外観検査が行えるモデルの作成に成功しました。今後は、単に良品と不良品を判断するだけでなく、熟練検査員の知識をAIに学習させることで、不良品と判断した理由や、どこに不良があるといった指摘まで行ってくれるさらに優れた超汎用検査AIの実現に向けて研究を進めていく予定です。さらに開発を加速するために、予算が許せば近いうちにもう1台NVIDIA DGX H100を導入したいと考えています。

導入システム NVIDIA DGX H100

事例ドキュメント

NVIDIA社 事例 WEBリンク

加藤先生、酒井様、研究室の皆様、ご多忙のところHPCテック導入事例掲載にご協力をいただき誠にありがとうございました。少しでも研究活動にお役に立てる様、スタッフ一同全力でお手伝いをさせていただきます。

弊社では、科学技術計算や解析などの各種アプリケーションについて動作検証を行い、
すべてのセットアップをおこなっております。
お客様が必要とされる環境にあわせた最適なシステム構成をご提案いたします。