【Microsoft Ignite 2025】Microsoft Foundry の AI オブザーバビリティによる監視、最適化、スケーリング:講演レポート
Microsoft Ignite 2025とは?
Microsoft Igniteは、マイクロソフトが年に一度開催する、ITプロフェッショナルや開発者、業界のリーダーたちを対象とした最大級のテクノロジーイベントです。AI、クラウド、セキュリティなどの最新技術やビジョンが発表され、世界中から注目されています。
今年のMicrosoft Igniteは、サンフランシスコとオンラインにて開催。「AIの時代にインパクトを与えるために必要なエッジを手に入れる」をテーマに、AIの活用がビジネスの中心となる中、その可能性を最大限に引き出すための知識やスキルを深める場となります。
セッション情報
本講演は、AIエージェントの振る舞いを可視化し、その信頼性を向上させる「Foundry Observability」の製品責任者を務めるSebastian氏と、彼のエンジニアリングカウンターパートであるSam氏が登壇。さらに、パートナー企業であるCarMaxのデータ・AIエンジニアリング担当バイスプレジデント、Abi氏も加わり、それぞれの立場からAIエージェントの未来について語りました。
講演の主題は、「AIエージェントが本質的に持つ非決定性(予測不可能性)がいかに開発と運用の課題となっているか」という問題提起。そして、「開発から本番監視、最適化に至るAIライフサイクル全体を、オブザーバビリティ(可観測性)によっていかに信頼性を高め、管理していくか」に関する内容でした。
本記事では、講演で発表されたAIエージェントのライフサイクル全体を網羅する新機能群「Foundry Observability」、パートナー企業CarMaxによる先進的な活用事例、そして多数のエージェントを全社的に管理するための未来像までを、現場の運用担当者の視点から詳しく解説します。
| セッション番号 | BRK119 |
|---|---|
| セッション名 | Monitor, optimize and scale with AI Observability in Microsoft Foundry(Microsoft Foundry の AI オブザーバビリティによる監視、最適化、スケーリング) |
| セッション概要 | あらゆる場所のあらゆるエージェントを管理する準備はできていますか? 盲目的に行動するのではなく、エージェントフリートを完全に可視化しましょう。 Foundryのコントロールプレーンとオブザーバビリティは、AIを安心して運用するためのダッシュボード、診断、最適化ツールを提供します。稼働時間とインパクトを重視するなら、このFoundryセッションはまさにうってつけです。 |
| 登壇者 | Abhi Bhatt氏(CarMax社|VP, Data & AI engineering) Sebastian Kohlmeier氏(Microsoft社|Principal PM Manager) Sam Naghshineh氏(Microsoft社|GM) |
【新発表】Foundry Observabilityの機能群が、Foundry Control Planeに統合
本講演は、マイクロソフトの製品責任者であるSebastian氏によって開始されました。彼は、AIエージェントが本質的に持つ非決定性が、開発者や運用者にとって信頼性や一貫性の面で大きな課題となっていると指摘。
そして、この課題を解決するため、信頼性の高いAIエージェント開発には「パフォーマンス、品質、安全性を高めるためのオブザーバビリティが不可欠である」と強調しました。
これを受けて、AIエージェントのライフサイクル全体にわたる可視性、監視、最適化を提供する「Foundry Observability」の機能群が、今回新たに発表されたAIエージェントの一元管理基盤「Foundry Control Plane」に統合され、パブリックプレビューとして利用可能になったと発表されました。
まずは、その中核となるFoundry Observabilityの具体的な新機能から見ていきましょう。

これにより、開発の初期段階から本番稼働、そしてフリート(集団)全体の管理まで、一貫したオブザーバビリティが実現します。
Foundry Observabilityの新機能
今回のIgniteでは、Foundry Observabilityを構成する具体的な新機能が数多く発表されました。一覧でまとめると、以下の通りです。
| 機能カテゴリ | 発表内容 | ステータス |
|---|---|---|
| 評価プラットフォーム | モデルとデータセット向けの評価機能 | Ignite直後に一般提供開始(GA) |
| トレーシング | マルチエージェントシステム向けのトレーシング | パブリックプレビュー |
| エージェント評価 | 新しいリスク・安全性評価、ツール・マルチエージェント特化の評価 | パブリックプレビュー |
| 本番監視 | Azure Monitorと連携したアラート機能 | 新機能 |
| 最適化 | 評価比較、クラスター分析、エージェントチャット | 新機能 |
| AI Red Teaming | 新しいエージェントの安全性リスク評価 | 新機能 |
【デモ】開発ライフサイクルを支える新機能
セッションでは、開発の各フェーズで利用できる新機能がデモを交えて紹介されました。
信頼性の高いエージェントを早期に構築
開発の初期段階でエージェントの品質と安全性を確保するため、Foundryレポート内で利用できる新しい評価機能が紹介されました。

これには、ユースケースに合わせて調整できるカスタム評価ツール、数分で評価を開始できる合成データセット生成、チームでの評価を可能にする人間による評価、そして安全性リスクを調査する自動レッドチーミングサポートが含まれます。
デモでは、アウトドア用品のカタログに関する質問に答える「Zava Outdoors」エージェントが使用されました。「サンフランシスコの秋に適したジャケット」を質問すると、エージェントは適切な商品を提案し、バックグラウンドで実行された「意図解決」と「タスク遵守」の評価が成功したことが示されました。
さらに、評価プラットフォームを使い、大規模なデータセットでエージェントのパフォーマンスをテストする方法も紹介されました。
本番監視と最適化で、継続的な改善サイクルを実現
エンジニアリング担当のSam氏に交代し、セッションは本番運用フェーズに移りました。彼は、本番環境での監視と最適化が継続的なプロセスであることを強調し、そのための新しい「エージェント監視ダッシュボード」を発表しました。

このダッシュボードは、本番トラフィックの継続的な評価、ドリフト検出のためのスケジュール評価、脆弱性を探すレッドチーミング、そしてAzure Monitorと連携した評価アラートといった機能を提供します。
デモでは、監視ダッシュボードで「タスク遵守」のスコアが低下しているアラートを検知し、そこからトレース情報にドリルダウンする様子が示されました。調査の結果、エージェントが適切なツールを呼び出さずに回答を生成してしまうハルシネーション(AIの誤回答)が原因であることを特定しました。
さらに、エージェントを最適化するための新機能として、異なる評価結果を比較する機能や、クラスター分析によって問題点を自動的にグループ化する機能が紹介されました。特に、自然言語でFoundryに質問し、モデルのアップグレードなどを指示できるエージェントチャット機能「Ask AI」が便利そうでした。
【パートナー事例】CarMaxにおける高度なAI活用
次に、米国最大の中古車販売店であるCarMax社のデータ・AIエンジニアリング担当バイスプレジデント、Abi氏が登壇しました。
同社は、顧客体験を向上させる仮想アシスタント「Sky」に生成AIを導入するにあたり、Microsoft Foundryを駆使して高度な評価フレームワークを構築したと言います。

Skyの利用イメージ。顧客はWebサイト上に表示される仮想アシスタントSkyに、商品の質問を入力できる
CarMaxは、Azureが提供するランタイムガードレールや安全性評価などの標準機能に加え、自社の法的要件を遵守しているかを確認する「法的遵守エージェント」や、顧客の意図を正しく理解しているかを測る「意図検出エージェント」といった、ビジネスに特化したカスタム評価ツールを構築しました。
さらに、Azure DevOpsを用いたCI/CDパイプラインにこれらの評価プロセスを統合。新しいバージョンのSkyをデプロイする際には、自動的に評価スイートが実行され、そのスコアを人間が確認した上でリリースを承認するという、品質を担保するための厳格なプロセスを運用しています。
この取り組みにより、顧客満足度を示すネットポジティブフィードバックが10ポイント向上し、自己解決率も25%増加するなど、大きな成果を上げています。
【新発表】企業全体のAIガバナンスを強化する「Foundry Control Plane」
セッションの序盤では、Foundry Control Planeに統合されたオブザーバビリティ機能が紹介されました。そしてセッションの最後には、その管理基盤である「Foundry Control Plane」自体が持つ、より広範なガバナンス機能が改めて深掘りされました。
このコントロールプレーンは、組織内に存在する多数のエージェントを一元的に管理・監視するための司令塔として機能します。

特に画期的なのは、Google Vertex AIやAWS Agent Coreなど、Foundry以外のプラットフォームで構築されたエージェントも登録し、一元的に監視できる点です。
これはOpenTelemetryの標準セマンティクスを活用することで実現されており、開発された環境を問わず、すべてのエージェントの稼働状況、コスト、パフォーマンス、トレース情報を単一のダッシュボードで可視化できます。
これにより、IT部門は全社的なAIガバナンスを効かせ、統一されたセキュリティポリシーの適用やコスト最適化を推進することが可能になります。
【Ops Today解説】 講演から読み解く、AIエージェントの運用トレンド
本講演で発表された内容は、AIエージェントの導入を目指すすべての企業、特にIT運用チームにとって、重要な情報に富んでいました。特に重要だと感じたポイントを、3点解説します。
1. AIという「ブラックボックス」をこじ開けるオブザーバビリティ
従来のシステム監視は、CPU使用率やエラーレートといった「結果」を観測するものでした。しかし、AIエージェントの運用で問題となるのは、「なぜAIがそのように振る舞ったのか」という「過程」の不透明さです。
今回のFoundry Observabilityは、まさにこのAIのブラックボックス化に挑むものです。デモで示された「幻覚(Hallucination)」の検出や、意図通りのツールを呼び出しているかの評価は、AIの内部的な意思決定プロセスにまで踏み込む新しいオブザーバビリティの形と言えます。
これは、AIの振る舞いがビジネスに与える影響を、運用チームがプロアクティブに管理するための第一歩だと言えるでしょう。
2. AIそのものを安定的に運用する時代へ
CarMaxの事例は、AI開発におけるDevOpsの進化形を示しています。CI/CDパイプラインに「法的遵守」といったビジネス要件を含む評価を組み込むことで、開発スピードとガバナンスを両立させています。
これは、単にAIを運用(AIOps)に使うだけでなく、「AIそのものを安定的に運用する(Ops for AI)」という新しい概念への移行したように感じます。
運用チームは、もはやインフラの安定性だけを担保するのではなく、AIモデルの回答品質やコンプライアンス遵守といった、よりビジネスに近い領域の信頼性にも責任を持つことになる可能性もあるかもしれません。
3. マルチクラウド、マルチフレームワーク時代のエージェント統制
多くの企業では、用途に応じて複数のクラウドを使い分け、様々なフレームワークでAIエージェントが開発されています。この「サイロ化」は、全社的なガバナンスやコスト管理の大きな障壁となります。
Foundry Control Planeが、OpenTelemetryを基盤にマルチクラウドのエージェントを一元管理できると発表した点は、この課題に対する明確な回答です。
運用チームは、乱立するエージェント群を単一のダッシュボードで監視・統制できるようになり、運用負荷を大幅に削減しながら、全社的なセキュリティポリシーの適用やコストの最適化を一貫して行えるようになります。
この講演は、AIエージェントが「作って終わり」の実験的なフェーズから、「管理・運用してこそ価値を生む」という本格的なエンタープライズ活用のフェーズに入ったことを象徴しているように感じました。
まとめ
このセッションで発表されたFoundry Observabilityの機能群は、AIエージェント開発における品質、安全性、信頼性の課題に対する包括的なソリューションを提供します。
特に、ビジネス要件に合わせた柔軟な評価フレームワークの構築能力と、マルチクラウド環境にまたがるエージェントフリートを一元管理できるガバナンス機能は、企業がAI活用を本格化させる上で強力な武器となるでしょう。
Microsoftは、開発から運用、そして統治に至るまで、AIライフサイクルのあらゆる段階をサポートすることで、エンタープライズAIの未来を牽引していく姿勢を明確に示しました。