キーワードで検索

今日を知り、明日を変えるシステム運用メディア

産総研によるAIクラウド計算システム「ABCI3.0」 その特徴とユースケースは?

産総研によるAIクラウド計算システム「ABCI3.0」 その特徴とユースケースは?

生成AIをはじめとしたAIモデルの開発・運用にあたっては、GPU・CPU・メモリなど膨大な計算資源が必要となります。このニーズに対応すべく、産総研ではABCIと呼ばれるAIクラウド計算システムを開発・提供しています。

2025年1月20日より、このABCIの最新バージョンであるABCI3.0がリリースされました※1。今回は、このABCI3.0について詳しくご紹介します。

※1参考:独立行政法人産業技術総合研究所「ABCI 3.0の提供開始日時のお知らせ

ABCI3.0の概要

はじめに、ABCI3.0の概要からご紹介します。

ABCI3.0とは?

ABCI3.0は、産業技術総合研究所(産総研)が開発した次世代のAIクラウド計算システムです。前バージョンから大幅にスペックがアップグレードされ、その膨大な計算能力により高度なAIモデルの開発において有効に活用できます。

ABCIは「AI Bridging Cloud Infrastructure:AI橋渡しクラウド」の略称であり、AI技術開発のための橋渡しとなるオープンな計算インフラとして提供されています。

初代ABCIは2018年8月に運用を開始し、2021年5月にABCI2.0へとバージョンアップされています。今回、ABCI3.0にアップグレードされた最新のクラウド環境の提供が開始されました。

ABCI3.0の特徴

ABCI3.0はAI特化型のクラウドサービスであり、主にAIモデルの開発や大規模シミュレーション用途に利用できます。

産総研によれば、ABCI3.0の主な特徴は以下のとおりです。

〇超高密度・超省電力データセンター

ABCI3.0では二重構造を採用し、通常の数倍の熱密度を実現しています。冷却システムでラックあたり70kWの冷却を可能にし、電力と運用コストを削減しています。

〇デファクトスタンダードアーキテクチャの採用

標準的なハードウェア製品やAIアクセラレーターを使用し、利用者にとって費用対効果の高い設計を提供しています。

〇ソフトウェアエコシステムの活用

最先端のミドルウェアや並列化コンパイラ、コンテナ環境など、最新のAI開発環境を備えた開発・実行環境を提供しています。また、Webブラウザ上でのコンソール操作やファイル操作、Webアプリケーションの利用も可能です。

〇データの安全な活用の促進

マルチペタバイトスケールの高速ストレージやデータ共有基盤が提供されます。また、通信路とデータは暗号化され、セキュアな環境下でのAI開発が可能です。

〇データセットの提供

その他にも、利用者のデータや学習済みモデルをカタログ化する「ABCIデータセット」という仕組みも用意されています。

ABCI3.0のスペック

ABCI3.0には、6,128基のNVIDIA H200 GPUアクセラレーターが搭載された、合計766台の計算ノードが用意されています。これらの計算ノードを中心として、75PB(ペタバイト)のストレージ、高速接続を実現するInfiniBandネットワーク、およびファイアウォールなどのセキュリティデバイス、および各種ソフトウェア群が提供されます。

ABCI2.0が120台の計算ノードに960基のNVIDIA A100 GPUアクセラレーターが用意されたシステムであったことを踏まえると、ABCI3.0では大幅にスペックが増強されたといえるでしょう。

また、ABCIシステムは学術情報ネットワークSINET6を介して外部ネットワークからの接続も可能です。SINET6は400Gbpsという高速ネットワークであり、安定したインターネット接続も提供されます。

ABCI3.0で利用できる計算ノードのスペックは以下のとおりです。ABCI3.0の計算ノードは単体で8,122AI-TFLOPSの性能を誇り、機械学習に必要とされる半精度浮動小数点の演算を1秒間に8千兆回行うことができます。また、科学技術計算で必要とされる倍精度浮動小数点演算おいては、計算ノード単体で542TFLOPSの性能を有します。

項目スペック個数
CPUIntel Xeon Platinum 8558 2.1GHz, 48cores2
GPUNVIDIA H200 SXM 141GB8
Memory64 GB DDR5-5600 4400 MHz32
SSDNVMe SSD 7.68 TB2

ABCI3.0のスペック詳細については、産総研のWebサイトもご覧ください。

2025年1月、ABCI3.0の一般利用が開始

2025年1月、ABCI3.0の一般利用が開始

2025年1月20日より、ABCI3.0の一般利用が開始されました。以下では、利用方法と利用料金についてご紹介します。

利用方法

ABCI3.0の利用にあたっては、まず利用申請が必要です。申請にあたっては、ABCI利用者ポータルより必要事項を入力し、送信します。申請が受理されると、利用責任者宛てにメール通知がされます。

その後、メールに記載されているログイン情報を利用し、利用者ポータルよりログインを行います。利用者ポータルでは、公開鍵の登録やストレージの管理、アクセスキーの発行などを行うことができます。

なお、ABCIを実際に利用する際には、SSH公開鍵認証による接続を行います。SSHクライアントより、ABCIシステムのフロントエンドであるインタラクティブノードへ接続します。接続後はABCI上でのプログラム実行のほか、後述するABCIポイントの残高確認などを行うこともできます。

料金

ABCI3.0ではポイント制による課金形態が採用されています。まずポイントを購入の上、計算資源の利用に充当することで、サービスを利用できる仕組みです。なお、2024年度においては、1ポイント220円と設定されています。

たとえば、8GPU、96コア、1728GBメモリの計算ノードを利用する場合、1時間あたり7.5ポイントが消費されます。また、1GPU、8コア、144GBメモリという少しスペックの落ちる計算ノードであれば、1時間当たり1.5ポイントで利用できます。

詳細な料金については、ABCIの料金表もご確認ください。

ABCI3.0で利用できるツール

ABCI3.0では、以下のような一般的なツールが利用可能です。これらのツールやライブラリを利用することで、新たなツールやフレームワークなどの学習をせずとも、効率的に開発や研究を進めることができます。

ツール分類概要
GNU Compiler Collection (GCC)開発ツールGNUプロジェクトによって開発されたコンパイラの集合体。C、C++、Fortran、Ada、Goなどをサポート。
Intel oneAPI開発ツールIntelが提供する開発ツールキット。高性能計算やAI、データ分析などを支援する。
OpenMP開発ツールマルチプロセッサ・プログラミングのためのAPI。並列プログラミングを容易にする指示やライブラリを提供する。
CUDA開発ツールNVIDIAが開発した並列計算プラットフォーム。GPUを用いた高性能計算を可能にし、科学技術計算や機械学習に利用できる。
Singularityコンテナツール高性能計算環境で使用されるコンテナ技術。アプリケーションの依存関係を隔離し、再現性の高い環境を提供する。
Intel MPIMPI(注)通信効率を高めデータ転送速度とスケーラビリティに優れたMPI。
NVIDIA HPC-XMPI(注)CUDAやGPUを活用した並列処理が可能。

(注)MPI:Message Passing Interfaceの略であり、複数のコンピューター上で並列計算を行う技術のこと。

また、ABCI3.0では開発言語としてPython、Ruby、R、Java、Scala、Perl、Goといった各言語を利用できます。

企業におけるユースケース

ここまで、ABCI3.0の概要を解説してきましたが、ABCI3.0は企業においてはどのように利用することができるのでしょうか。以下では、いくつかユースケースの例をご紹介します。

独自のLLM構築

企業が独自の大規模言語モデル(LLM)を構築するためには、膨大な計算資源が必要となります。単一企業でこれを用意するのは簡単ではなく、ABCI3.0の高性能な計算資源の活用が有効です。

ABCI3.0には、膨大な計算能力とストレージ容量が用意されています。企業がLLMの開発やトレーニング、運用を行うにあたって、有効に活用できます。

高度なシミュレーション

高度なシミュレーションにおいて課題となるのが、計算資源の確保です。ABCI3.0は、航空宇宙、製造、エネルギーなどの分野で高度なシミュレーションを実行する際にも活用できます。たとえば、流体力学の解析や材料の特性評価、気候モデルのシミュレーションなど、多岐にわたるシナリオに対応できます。

ABCI3.0の高性能なハードウェアと計算能力を活用することで、シミュレーションの実現や精度向上が可能となります。

研究開発

医薬品の開発や材料科学、環境科学やエネルギー研究など、研究開発において高度な分析を行う際にもABCI3.0は重要なツールとなります。

トライアンドエラーで分析・調査を行う際に、利用実績に応じて課金され、柔軟にリソースを利用できるクラウド型の計算資源は効率的です。ABCI3.0であれば、大量の計算リソースを自由に利用できるため、研究開発目的での活用も可能となります。

ABCIの利用事例

最後に、企業におけるABCIの利用事例をご紹介します。

三菱重工業

三菱重工業株式会社は、エナジー、プラント・インフラ、物流・冷熱・ドライブシステム、航空、宇宙など多岐にわたる事業を展開しています。同社のデジタルイノベーション本部ではAI技術や画像処理技術を用いて、500以上の製品群の知能化・自律化を目指し、取り組みを進めています。

一例として、倉庫のフォークリフトなど、作業現場で活躍する産業車両の安全運転支援システムの開発においてABCIを活用しています。同社では産業車両の安全運転支援を目的とし、車両にカメラをつけて周辺を撮影し、進行方向に人がいる場合にアラームを鳴らす画像認識システムを開発しました。

作業現場という特殊な環境に合わせてAIをカスタマイズし、工場や倉庫のデータ収集を効率化する技術の開発において、ABCIが有効に活用されています。

ABCI導入事例「三菱重工業株式会社様

パナソニック

家電メーカーとして広く知られているパナソニック株式会社では、IoTを活用したBtoBビジネスへの参入も進めています。同社ではABCIを利用して、高い情報セキュリティを持つ独自のセキュリティ環境を構築し、事業データを使用した研究開発を行っています。

研究開発においては、「くらしアップデート」というビジョンの下、個人の生活だけでなく、社会全体の最適化を目指しています。たとえば、材料デバイス開発においてABCIを利用することで、材料開発にかかる時間を短縮し、競争力を高めています。また、自動運転における画像認識機能の開発などにもABCIを活用しているとのことです。

ABCI導入事例「パナソニック株式会社様

日本原子力研究開発機構(JAEA)

日本で唯一の原子力に関する総合的研究開発機関である日本原子力研究開発機構(JAEA)では、超高速風予報の研究にABCIを利用しています。

本研究は放射性物質の拡散評価を目的としており、リアルタイムで風向き・風速を踏まえたシミュレーションを行っています。このような複雑なパラメータが存在する大規模シミュレーションにあたっては、膨大な計算資源が必要です。ABCIの膨大な計算資源を利用することで、JAEAでは高性能なシミュレーションを実現しています。

今後はABCIにて2000GPUを同時利用し、エクサスケールコンピューティングによるシミュレーションを進めていくとのことです。

ABCI導入事例「国立研究開発法人 日本原子力研究開発機構(JAEA) 様

株式会社Preferred Networks

AI開発において最先端企業として認知されているPreferred Networks。同社では、ABCIを利用してLLMの開発を進めています。

Preferred Networksでは独自の計算資源を保有しているものの、LLMの構築のような大規模な計算資源を継続的に消費するようなユースケースにおいては、外部の大規模計算環境が必要と判断しました。

同社では、ABCIの計算ノード60ノードを利用し、LLMの学習と推論を実施。開発されたLLMは、PLaMoとして公開されています。

ABCI導入事例「株式会社Preferred Networks様

まとめ

今回は、産総研によるAIクラウド計算システム「ABCI3.0」について詳しくご紹介しました。

ABCI3.0は比較的手軽に利用できる超大規模計算資源として、有効な選択肢となります。特にAIモデルの開発においては大規模な計算リソースを必要とする場合や、大規模なシミュレーションを行う場合などにおいては、活用を検討してみてはいかがでしょうか。

最新情報をお届けします!

最新のITトレンドやセキュリティ対策の情報を、メルマガでいち早く受け取りませんか?ぜひご登録ください

メルマガ登録

最新情報をお届けします!

最新のITトレンドやセキュリティ対策の情報を、メルマガでいち早く受け取りませんか?ぜひご登録ください

メルマガ登録