キーワードで検索

今日を知り、明日を変えるシステム運用メディア

【2025年8月最新】OpenAIの主要なモデル一覧 ─特徴や料金、利用方法など 

【2025年8月最新】OpenAIの主要なモデル一覧 ─特徴や料金、利用方法など

2025年6月にOpenAI o3の上位モデル「OpenAI o3-pro」がリリース、OpenAI o3価格の80%値下げが発表、8月にはGPT-5シリーズを発表するなど、連日ニュースの絶えないOpenAI。

モデルが数多く存在する中で、それぞれどのような特徴があり、どう使い分ければ良いのか分からなくなる方もいらっしゃると思います。

以下は、2025年8月12日10時の時点で、OpenAIの公式サイトに基づき、現在利用可能なOpenAIのモデルをまとめたリストです。公式ドキュメントを参照し、APIを通じて利用可能な主要なモデルをカテゴリ別に整理しました。

なお、モデルの可用性や詳細な仕様は変更される可能性があるため、最新情報は公式サイトにてご確認ください。

【2025年8月7日】 発表された新情報まとめ

OpenAIは、2025年8月7日にGPT-5を正式に発表しました。

GPT-5の登場に伴い、OpenAIは一部の旧世代モデルの提供方針を変更しGPT-4o, o3, o4-miniなどがChatGPTのモデル選択画面から削除されました。(APIを利用する開発者や、一部の法人ユーザーは引き続きアクセス可能ですが、一般ユーザーにとっては実質的な提供終了に近い状態)

今まで多数あった利用可能なモデルの数が減った事で、利用者はどのモデルが最適かより選択しやすくなったと思います。

Reasoningモデル(推論モデル)

ここからは、OpenAIの主要なモデルの特徴や料金、利用方法などをまとめます。推論モデルは、複雑なタスクに対して深く考え、科学、数学、コーディングなどの分野で高いパフォーマンスを発揮するように設計されています。

OpenAI o4-mini

GPT-5登場後も、特定のユースケース向けに提供が継続されています。

概要高速かつ低コストの推論モデルで、数学、コーディング、科学、視覚的推論に特化。ChatGPTの全ツール(ウェブ検索、Python、画像解析など)を自律的に活用し、複雑な問題を効率的に解決します。
特徴o3-miniと同等の価格設定で従来のGPT-3.5 Turboより60%以上安価でありながら、性能は大幅に向上。テキストと画像の両方を処理可能。
ユーザーのプロンプトを安全仕様に基づいて評価し、悪意のある意図を検知。
利用方法API:Chat Completions APIやResponses APIで開発者向けに提供。Azure OpenAI Serviceでも利用可能。

ChatGPT:Plus/Pro/Teamユーザーはモデルセレクターから即時利用可能。無料ユーザーは「Think」モードで制限付き利用。

Codex CLI:ローカル端末でのコーディング支援に使用可能。
コンテキストウィンドウ入力:128,000トークン(約75万語)。
出力:最大16,384トークン。
料金API:入力$1.10/Mトークン、出力$4.40/Mトークン。Batch APIで50%割引。

Azure:入力$0.15/Mトークン、出力$0.60/Mトークン(地域による)。

ChatGPT:サブスクリプション内で追加料金なし。
リリース情報2025年4月に発表

OpenAI o3-mini

GPT-5 Nano/Miniが登場しましたが、o3-miniも引き続き利用可能です。

概要o3の軽量版で、リソース効率を重視しつつ高い推論能力を維持。迅速なタスク処理に適している。
特徴o3と同様にテキスト入力・出力に対応。科学や数学のタスクで高いパフォーマンスを発揮。
利用方法APIおよびAzure OpenAI Service(米国の特定リージョン)で利用可能。
コンテキストウィンドウ200,000トークン。
料金公式ドキュメント、Pricing ページに記載無し(2025-06-11時点)
リリース情報2025年2月にリリース

GPTモデル(汎用言語モデル)

これらのモデルは、低レイテンシでコスト効率が高く、テキスト生成やチャット用途に最適化されています。

GPT-5

概要OpenAIの最新かつ最も高性能なフラッグシップモデル。専門家レベルの複雑なタスクを処理するために設計されています。
特徴最高の推論能力、精度、創造性を持ち、複雑な問題に対して深く思考する「Thinkingモデル」を内蔵しているため、研究開発や高度な分析、専門的な文章作成に最適です。
モデルIDgpt-5
利用方法ChatGPTの全ユーザーが利用可能。Plus/Pro登録者はより多くの利用量や高機能版「GPT-5 Pro」にアクセスできる。API経由でも利用可能。
コンテキストウィンドウ入力: 最大272,000トークン
出力: 最大128,000トークン
料金入力 $1.25 / 100万トークン
出力 $10.00 / 100万トークン 
リリース情報2025年8月7日にChatGPTユーザーおよびAPIで一般提供開始。

GPT-5 mini

概要性能と速度のバランスが取れた標準モデル。ほとんどの日常的なタスクや、一般的な対話アプリケーションに最適です。
特徴圧倒的な低レイテンシ(低遅延)と低コストが特徴です。性能はMiniより限定的ですが、速度が最優先されるタスクに特化しており、単純なテキスト分類やデータフィルタリング、UI操作の補助などで活躍します。
モデルIDgpt-5-mini
利用方法ChatGPTでは、主に利用上限に達した際の代替モデルとしてシステムに自動で利用されます。ユーザーが直接選択するモデルではありません。API経由では、速度とコストのバランスが求められる用途でgpt-5-miniとして利用可能です。
コンテキストウィンドウ入力: 最大272,000トークン
出力: 最大128,000トークン
料金入力 $0.25 / 100万トークン
出力 $2.00 / 100万トークン
リリース情報2025年8月7日にChatGPTユーザーおよびAPIで一般提供開始

GPT-5 nano

概要最速・最軽量で、リアルタイム処理を目的としたモデル。デバイス上での動作や、即時応答が求められるシステム向けです。
特徴圧倒的な低レイテンシ(低遅延)と低コストが特徴です。性能はMiniより限定的ですが、速度が最優先されるタスクに特化しており、単純なテキスト分類やデータフィルタリング、UI操作の補助などで活躍します。
モデルIDgpt-5-nano
利用方法ChatGPTでユーザーが直接利用することはありません。システムの内部処理で利用されることがあります。API経由では、リアルタイム性が求められる非常に高速な処理のためにgpt-5-nanoとして利用可能です。
コンテキストウィンドウ入力: 最大272,000トークン
出力: 最大128,000トークン
料金入力 $0.05 / 100万トークン
出力 $0.40 / 100万トークン
リリース情報2025年8月7日にChatGPTユーザーおよびAPIで一般提供開始

gpt-oss-120b

概要OpenAIがリリースした1170億パラメータを持つオープンウェイトの高性能言語モデルです。 
Mixture-of-Experts (MoE) アーキテクチャを採用しており、推論(タスク実行)時には51億のパラメータがアクティブになります。 性能はo4-miniに匹敵するとされています。
特徴Apache 2.0ライセンスで公開されており、研究から商用利用まで幅広く活用できます。 また、推論、コーディング、数学、ツール利用など、複雑なタスクで高いパフォーマンスを発揮。80GBのGPUメモリを搭載した単一のGPUで効率的に動作します。
モデルIDgpt-oss-120b
利用方法モデルの重みはHugging Faceから無料でダウンロードできます。 また、Amazon SageMakerやAzure AI Foundryなどのクラウドプラットフォーム経由でも利用可能です。
コンテキストウィンドウ128,000トークン(約128k)
料金オープンウェイトモデルのため、モデル自体の利用は無料です。 ただし、実行するためのクラウドサービスやサーバーの利用料金は別途発生します。
リリース情報2025年8月5日に発表

gpt-oss-20b

概要gpt-oss-120bと同時にリリースされた、210億パラメータを持つ軽量版のオープンウェイト言語モデルです。 MoEアーキテクチャにより、推論時には36億のパラメータがアクティブになります。 o3-miniと同等の性能を持つとされています。
特徴Apache 2.0ライセンスで公開されており、商用利用も可能。 16GB程度のメモリを搭載した一般的なノートPCやエッジデバイスでも動作するように設計されています。
ローカル環境での推論や、特に数学・ヘルスケア分野のタスクで強みを発揮します。
モデルIDgpt-oss-20b
利用方法gpt-oss-120bと同様に、Hugging Faceからモデルをダウンロードして利用できます。
コンテキストウィンドウ128,000トークン(約128k)
料金モデル自体の利用は無料。ローカル環境で実行する場合、追加コストはかかりません。
リリース情報2025年8月5日に発表

画像生成モデル(DALL·E)

DALL·E 3が最新版として、ChatGPTやAPIを通じて利用できます。

概要自然言語から画像を生成・編集するモデル。クリエイティブな用途に適している。
特徴テキストプロンプトに基づく画像生成。API経由で高解像度画像を生成可能。
利用方法APIで利用可能。ChatGPT Plusでも一部機能が利用可能。
料金標準解像度:$0.020 / 画像
※ 高解像度や編集機能は別料金。
リリース情報2024年9月にDALL・E 3をリリース

音声モデル(Whisper)

引き続き、音声認識の主力モデルとして提供されています。

概要音声をテキストに変換する音声認識モデル。音声翻訳や文字起こしに使用される。
特徴多言語対応。高い精度で音声をテキスト化。
利用方法APIで利用可能。オープンソース版も提供。
料金$0.006 / 分(音声処理)
リリース情報2022年9月に公開

埋め込みモデル(Embeddings)

text-embedding-3-large

概要第3世代の埋め込みモデル。テキストを高次元ベクトルに変換し、検索や分類に使用。
特徴:ディメンション数を調整可能(最大3,072)。MTEBベンチマークで高いパフォーマンス。
特徴ディメンション数を調整可能(最大3,072)。MTEBベンチマークで高いパフォーマンス。
利用方法APIで利用可能。
料金$0.13 / 1Mトークン
リリース情報2024年1月にリリース。

text-embedding-3-small

概要軽量な埋め込みモデル。コスト効率を重視した用途に適している。
特徴ディメンション数は最大1,536。低リソース環境でも動作。
利用方法APIで利用可能。
料金$0.02 / 1Mトークン
リリース情報2024年1月にリリース。

Moderationモデル

omni-moderation-2024-09-26

最新のモデレーションモデルです。モデル名に日付が含まれていますが、これが最新版を指します。

概要テキストと画像を分析し、コンテンツがOpenAIの利用規約に準拠しているかを判定するマルチモーダルモデレーション。
特徴ヘイト、自傷、性的コンテンツ、暴力などのカテゴリを分類。
利用方法APIで利用可能。
料金
リリース情報2024年9月にリリース。

その他のモデル

GPT baseモデル

概要自然言語やコードを理解・生成するベースモデル。インストラクション遵守のトレーニングを受けていない。
特徴レガシーなCompletions APIを使用。GPT-3.5やGPT-4の使用が推奨される、非推奨モデル。
利用方法APIで限定的に利用可能。
料金入力:$0.40 / 1Mトークン
出力:$0.40 / 1Mトークン(モデルによる)。
リリース情報2023年にリリース。

Operator

概要Webブラウザを自律的に操作し、ユーザーの指示に基づくタスクを実行するAIエージェント。
特徴米国内限定で公開。タスク自動化に特化。
利用方法APIで利用可能(制限付き)。
料金公式ドキュメントに詳細なし
リリース情報2025年1月に公開。

廃止、提供終了予定、非推奨モデル

廃止済みモデル

これらのモデルは、すでに提供が終了しており、利用することはできません。

モデルシリーズモデル名廃止日推奨される代替モデル
GPTGPT-4.5 Preview2025-07-14GPT-5, GPT-4.1
Edits API 関連モデル(text-davinci-edit-001など)2024-01-04GPT-3.5 Turbo
ReasoningOpenAI o1, o1-pro不明(提供終了済み)o3, o4-mini, GPT-5

提供終了が予定されているモデル

これらのモデルは、指定された日付をもって提供が終了し、利用できなくなります。

モデルシリーズモデル名提供終了予定日推奨される代替モデル
ReasoningOpenAI o1-mini2025-10-27o4-mini, GPT-5 Nano
Moderationtext-moderation-0072025-10-27omni-moderation-latest

非推奨モデル(現在は利用可能)

これらのモデルは現在も利用可能ですが、性能やコスト面でより優れた新しいモデルが存在するため、OpenAIは移行を推奨しています。特に新規での利用は推奨されません。

モデルシリーズモデル名推奨される代替モデル備考
GPTGPT-4, GPT-4 Turbo, GPT-4.1GPT-5GPT-5の登場により、旧世代となりました。互換性維持などの目的以外での利用は推奨されません。
ReasoningGPT-4o, o3, o3-pro, o4-miniGPT-5GPT-5はこれらのモデルの能力を統合・凌駕しています。ChatGPTでは標準モデルがGPT-5に置き換わりました。
旧世代モデルGPT-3, Codex, text-davinci-002/003GPT-3.5 Turbo、GPT-5より高性能でコスト効率の良いモデルへ移行することが強く推奨されています。
埋め込みtext-embedding-ada-002text-embedding-3 (small/large)より高性能で安価なtext-embedding-3シリーズへの移行が推奨されます。

最新の廃止予定モデルリストは、公式サイトの「Deprecated Models」セクションより確認可能です。

OpenAI 各モデルのユースケース

利用用途や予算に応じて利用するモデルを検討する必要がありますが、ざっくり分類すると以下のようになります。ご参考ください。

コストと速度を重視する場合

GPT-4o-miniGPT-3.5-turboが適しています。

これらのモデルは、比較的安価でありながら高速な応答が可能なため、単純なチャットボットや、大量の文章の要約・翻訳、データ抽出といった定型的なタスクを効率的に処理するのに向いています。

最高の性能や複雑なタスクへの対応を求める場合

GPT-4oo1-proが選択肢となります。

これらはOpenAIの最上位モデルであり、専門的な知識を要する質疑応答、高度なデータ分析、複雑なコーディング支援など、高度な推論能力が不可欠な場面で力を発揮します。また、テキストだけでなく画像や音声も扱えるマルチモーダルな能力も特徴です。

特定の機能に特化したい場合

例えば、テキストから画像を生成したい場合はDALL·E 3、会議の音声などを高精度に文字起こししたい場合はWhisper、逆にテキストを自然な音声に変換したい場合はTTS(Text-to-Speech)が利用できます。さらに、オンラインコミュニティなどで不適切なコンテンツをフィルタリングするためには、Moderationモデルが役立ちます。

研究開発や自社環境での自由なカスタマイズする場合

オープンソース(オープンウェイト)として公開されているgpt-oss-120bgpt-oss-20bが最適です。

これらのモデルはライセンスの制約が緩やかで、自社のサーバーやローカル環境で自由にファインチューニング(追加学習)を行えるため、特定の業界やタスクに特化した独自のAIを開発する際に非常に有効です。

補足と注意点

トークンとは

1,000トークンは、英語の場合はおおよそ約750語です。日本語の場合は1トークン2~3文字。詳細はOpenAIのTokenizerでご確認いただけます。

また、コスト最適化を目的にトークン数を減らしたい場合は、プロンプトを短くする(例:「be concise」を追加)、CSV形式のデータを使用する(JSONよりトークン消費が少ない)といった対策が考えられます。

モデルID

APIでモデルを利用する際は、正確なモデルID(例:gpt-4o-2024-08-06)を指定する必要があります。各モデルのIDは公式ドキュメントに記載されています。

コンテキストウィンドウ

各モデルには入力・出力トークンの上限があり、超過すると出力が途切れる可能性があるのでご注意ください。

データプライバシー

2023年3月以降、API経由のデータはユーザーが明示的に許可しない限り学習に使用されません。ゼロ・データ保持オプションも選択可能。

地域制限

一部モデルはAzure OpenAI Serviceで特定リージョン(米国など)に限定される場合があります。

参考サイト

24時間365日のシステム運用監視サービス「JIG-SAW OPS」を提供する、JIG-SAW株式会社のOps Today編集部です。 サーバー運用監視実績50,000台の実績をもとに、システム運用監視に役立つ情報をお届けします!

最新情報をお届けします!

最新のITトレンドやセキュリティ対策の情報を、メルマガでいち早く受け取りませんか?ぜひご登録ください

メルマガ登録

最新情報をお届けします!

最新のITトレンドやセキュリティ対策の情報を、メルマガでいち早く受け取りませんか?ぜひご登録ください

メルマガ登録