
Amazon Bedrock の Amazon Nova Pro 基盤モデル向けにレイテンシー最適化推論を発表
本記事は、2025 年 3 月 5 日にAWS公式サイトの What’s New with AWS? に掲載された英語記事を自動翻訳したものです。
ニュース内容
Amazon Nova Pro 基盤モデルは、Amazon Bedrock のプレビューでレイテンシー最適化推論をサポートするようになりました。これにより、生成 AI アプリケーションの応答時間が短縮され、応答性が向上します。レイテンシー最適化推論により、レイテンシーの影響を受けやすいアプリケーションの応答時間が短縮され、エンドユーザーエクスペリエンスが向上し、開発者はユースケースに合わせてパフォーマンスを柔軟に最適化できるようになります。これらの機能を利用するには、追加のセットアップやモデルの微調整は不要で、既存のアプリケーションをすぐに強化して応答時間を短縮できます。
Amazon Nova Pro のレイテンシー最適化推論は、米国西部 (オレゴン)、米国東部 (バージニア)、米国東部 (オハイオ) リージョンのクロスリージョン推論で利用できます。Amazon Nova 基盤モデルの詳細については、AWS ニュースブログ、Amazon Nova 製品ページ、または Amazon Nova ユーザーガイドをご覧ください。Bedrock のレイテンシー最適化推論の詳細については、ドキュメントをご覧ください。Amazon Bedrock コンソールから、Amazon Bedrock で Amazon Nova 基盤モデルの使用を開始できます。
原文
Amazon Nova Pro foundation model now supports latency-optimized inference in preview on Amazon Bedrock, enabling faster response times and improved responsiveness for generative AI applications. Latency-optimized inference speeds up response times for latency-sensitive applications, improving the end-user experience and giving developers more flexibility to optimize performance for their use case. Accessing these capabilities requires no additional setup or model fine-tuning, allowing for immediate enhancement of existing applications with faster response times.
Latency optimized inference for Amazon Nova Pro is available via cross-region inference in US West (Oregon), US East (Virginia), and US East (Ohio) regions. Learn more about Amazon Nova foundation models at the AWS News Blog, the Amazon Nova product page, or the Amazon Nova user guide. Learn more about latency optimized inference on Bedrock in documentation. You can get started with Amazon Nova foundation models in Amazon Bedrock from the Amazon Bedrock console.
引用元:Announcing latency-optimized inference for Amazon Nova Pro foundation model in Amazon Bedrock