
OpenAI、「o3」と「o4-mini」を発表─高速・高コスト効率な最先端の推論モデル
2025年4月16日、OpenAIはOpenAIは最先端推論モデル「OpenAI o3」と低コストモデル「OpenAI o4-mini」をリリースした。をリリースした。これらは従来のAIの枠を超え、複雑な問題解決、視覚的思考、自律的ツール利用を可能にする革新的技術を備える。
本ブログ記事は、これらのモデルの特徴と可能性を詳しく紹介する。
- 参考:Introducing OpenAI o3 and o4-mini(公式リリース情報)
AIの思考を再定義
OpenAIの最新モデルは、AIを人類の「もう一つの脳」と位置づける。OpenAI o3は、OpenAIが開発した最先端の推論モデルである。複雑な数学やコーディング、科学、視覚的推論といった多様な分野で卓越した性能を発揮、人間超える精度で解決できる。
一方、OpenAI o4-miniは高速かつコスト効率に優れたモデルである。OpenAI o3の能力をほぼ継承しつつ、10分の1のコストで提供。幅広いユーザーや開発者にとってアクセスしやすい選択肢である。
これらのモデルは、情報処理に留まらず「思考」を重視する。OpenAIによれば、OpenAI o3とOpenAI o4-miniは「画像とともに考える」能力を有する。アップロードされた画像を単に見るだけでなく、推論プロセスに視覚情報を統合可能だ。
さらに、ウェブ検索、Pythonコード実行、画像生成といったChatGPTのツールを自律的に活用し、複雑なマルチステップの問題も解決できるという。
主な特徴と性能(OpenAI o3)
高度な推論能力
OpenAI o3は、従来モデルOpenAI o1を大幅に上回る性能を示す。競技プログラミング(Codeforces Elo 2727)、科学的問題(GPQA Diamond 87.7%)、汎用知能(ARC-AGI 87.5%)といった分野で人間を凌駕するスコアを出している。
視覚的思考
白板のスケッチや低品質な図表を解析し、科学的ポスターから新たな結論を導く。画像を活用した推論が可能である。デモでは、OpenAI o3が研究ポスターを分析し、インターネット検索を活用して新たな洞察を提供した。
ツールの自律利用
OpenAI o3は、ウェブブラウジング、Python実行、画像生成を自ら判断して使用する。ユーザーの指示を深く理解し、正確な結果を迅速に提供する。
ベンチマークでの優位性
GPQA Diamond(専門家レベルの科学問題)で87.7%、ARC-AGI(汎用知能のベンチマーク)で87.5%のスコアを記録し、こちらも人間レベルの性能を大きく超えるものとなっている。
主な特徴と性能(OpenAI o4-mini)
コスト効率と速度
OpenAI o4-miniは、OpenAI o3の10分の1以下のコスト(入力トークン1.10ドル/100万、出力4.40ドル/100万)で、ほぼ同等の性能を提供する。SWE-bench Verifiedで68.1%を記録。大量リクエストに対応しており、開発者にとって経済的な選択肢である。
高いスループット
高速処理により、大量のリクエストに対応可能である。OpenAI o3に比べ高い使用制限をサポートし、ビジネス用途に最適である。
視覚とツール利用
OpenAI o3と同様、画像の統合的推論やツールの自律利用が可能である。低コストながら、複雑なタスクを効率的に処理する。
新機能:視覚的思考とエージェント的動作
OpenAI o3とOpenAI o4-miniの最大の革新は、「視覚的思考」と「エージェント的動作」である。
従来のモデルは画像を「見る」だけだったが、これらのモデルは画像を推論プロセスに組み込む。ぼやけた図表から情報を抽出し、論理的な結論を導く。OpenAIのデモでは、OpenAI o3が科学的ポスターの画像を解析し、関連情報をウェブから収集して新たな結論を提示した。
両モデルは、ChatGPTの全ツール(ウェブ検索、Python、画像生成など)を自律的に使用可能である。ユーザーの指示に応じ、最適なツールを選択し、複雑な問題を段階的に解決する。OpenAIはこれを「エージェント的ChatGPTへの一歩」と表現。AIが将来的に独立してタスクを実行する可能性を示唆する。
安全性への取り組み
OpenAIは、OpenAI o3とOpenAI o4-miniの安全性を確保するため、強化された安全プログラムと改訂された準備枠組み(Preparedness Framework)に基づくストレステストを実施した。特にOpenAI o3には「熟慮的アライメント」と呼ばれる新技術が導入されている。モデル自身が安全ポリシーを理解し、潜在的に危険なプロンプトを正確に拒否する能力が向上した。
OpenAIは外部のレッドチームや安全研究者と協力し、モデルの堅牢性を検証する。OpenAI o3-miniは「中リスク」と評価されている。自己改善に関わる現実的な研究能力には限界があるが、継続的なリスク管理が強調される。
利用可能性と開発者向け情報
ChatGPTユーザー
ChatGPT Plus、Pro、Teamユーザーは、モデルセレクターでOpenAI o3、OpenAI o4-mini、OpenAI o4-mini-high(高推論モード)を即時利用可能である。EnterpriseおよびEduユーザーは1週間後にアクセス可能である。従来のOpenAI o1、OpenAI o3-mini、OpenAI o3-mini-highは置き換えられる。
開発者向け
OpenAI o3とOpenAI o4-miniは、Chat Completions APIおよびResponses APIを通じて利用可能である。OpenAI o3の価格は入力10ドル/100万トークン、出力40ドル/100万トークンである。OpenAI o4-miniはOpenAI o3-miniと同じ価格で、コスト効率が高い。
Codex CLI
OpenAIは、開発者向けにローカルで動作する軽量なオープンソースコーディングエージェント「Codex CLI」をリリースした。OpenAI o3およびOpenAI o4-miniをサポートし、近日中のGPT-4.1対応も予定する。
今後の展望:GPT-5への道
OpenAIのCEOサム・アルトマンは、OpenAI o3とOpenAI o4-miniのリリースがGPT-5の開発に大きく寄与すると述べる。
GPT-5は、推論モデルと非推論モデルを統合した次世代モデルとして期待される。OpenAI o3の技術がその基盤となる。アルトマンは、「GPT-5は当初の予想をはるかに超える性能になる」とコメント。AIの未来への意気込みを示す。
まとめ:AIと共創する未来
OpenAIの新モデルは、思考の拡張を超え、人類の物語を紡ぐ。科学、創造、教育――すべての領域で扉が開く。一方、安全ポリシーを理解し、潜在的に危険なプロンプトを正確に拒否する必要性があるなど安全性の担保も必要だ。
新たなAIの波にどう乗るか。OpenAI o3とOpenAI o4-miniが切り開く未来を共に探る時である。