
一般提供開始: NVIDIA NIM をサポートする Azure コンテナー アプリのサーバーレス GPU
本記事は、2025 年 3 月 18 日にMicrosoft公式サイトの Azure Updates に掲載された英語記事を自動翻訳したものです。
ニュース内容
NVIDIA NIM をサポートするサーバーレス GPU が、Azure Container Apps で一般提供されました。サーバーレス GPU を使用すると、自動スケーリング、最適化されたコールド スタート、使用していないときにスケールダウンしてゼロにする秒単位の課金、運用オーバーヘッドの削減により、AI ワークロードをオンデマンドでシームレスに実行して、簡単にリアルタイムのカスタム モデル推論やその他の GPU 関連タスクをサポートできます。
サーバーレス GPU を使用すると、顧客が GPU の使用時にインフラストラクチャの管理に費やす時間を減らし、コア AI コードに集中できるため、AI 開発チームのスピードが加速します。これにより、Azure AI モデル カタログのサーバーレス API とマネージド コンピューティングでのカスタム モデルのホスティングの間に、優れた中間層オプションが提供されます。この機能により、顧客はカスタム AI モデルを推論するための独自のサーバーレス API エンドポイントを構築できます。また、オンデマンドの GPU 搭載 Jupyter Notebook をプロビジョニングしたり、本質的に一時的な大規模な計算ニーズを持つその他の ML ワークロードを実行したりすることもできます。顧客のデータがコンテナーの境界を離れることがないため、完全なデータ ガバナンスが実現します。同時に、アプリケーションを構築するためのマネージド サーバーレス プラットフォームも提供されます。
このサーバーレス GPU の GA リリースでは、幅広い AI シナリオ向けに NVIDIA が特別に構築したコンテナーである NVIDIA NIM のサポートも追加されています。これらのすぐに使用できるソリューションは、大規模な言語モデルから視覚言語モデル、音声、画像生成などのモデルまで、さまざまなシナリオをサポートします。
詳細:
原文
Serverless GPUs with NVIDIA NIM support is now generally available in Azure Container Apps. Serverless GPUs enable you to seamlessly run your AI workloads on-demand with automatic scaling, optimized cold start, per-second billing with scale down to zero when not in use, and reduced operational overhead to support easy real-time custom model inferencing and other GPU related tasks.
Serverless GPUs accelerate the speed of AI development teams by allowing customers to focus on core AI code and less on managing infrastructure when using GPUs. This provides an excellent middle layer option between Azure AI model catalog’s serverless APIs and hosting custom models on managed compute. This feature will allow customers to build their own serverless API endpoints for inferencing custom AI models. Customers can also provision on-demand GPU-powered Jupyter Notebooks or run other ML workloads with larger computation needs that are ephemeral in nature. It provides full data governance as customer’s data never leaves the boundaries of the container while still providing a managed, serverless platform from which to build your applications.
This GA release of Serverless GPUs also adds support for NVIDIA NIMs, NVIDIA’s purpose-built containers for a wide range of AI scenarios. These out-of-the-box solutions support scenarios from large language models to visual language models, and models for speech, image generation, and much more.
Learn more:
- Read blog
- Read documentation
引用元:Generally Available: Serverless GPUs in Azure Container Apps with NVIDIA NIM Support