今日を知り、明日を変えるシステム運用メディア

2025/01/22 最終更新日：2025/01/22

新登場「DeepSeek-R1」、OpenAIの最新モデルo1並みの性能！API価格は衝撃の27分の1

ニュース #話題のニュースを深掘り！ #AI

目次

はじめに

2023年に中国で設立されたスタートアップのAI企業DeepSeek（ディープシーク）社が、2025年1月20日に最新のAIモデルである「DeepSeek-R1」をリリースし、AI業界に衝撃が走っています。

このモデルは、OpenAIのo1と同等のパフォーマンスを誇り、完全にオープンソースで提供されています。技術報告書も公開されており、誰でも自由に利用・商業化が可能です。

※本記事は、GitHubのDeepSeek社の公式リポジトリ、公式のリリース情報を参考にAIが作成しています

DeepSeek-R1

モデルの概要

DeepSeek R1は、強化学習（RL）を用いて訓練された初の大規模言語モデルです。

従来の監視付きファインチューニング（SFT）を必要とせず、自己検証や反省、長い思考過程を生成する能力を持っています。これにより、複雑な問題を解決するための新しい推論パターンを発見し、従来のモデルと比較して優れたパフォーマンスを発揮します。

特に、数学やコード、推論タスクにおいて、OpenAIのモデルと同等の性能を達成しています。

強化学習のアプローチ

DeepSeek R1は、強化学習を直接適用することで、モデルが自らの推論能力を探求できるように設計されています。

このアプローチにより、モデルは人間の好みに合わせた推論パターンを発見し、より効果的な結果を生み出すことが可能です。また、モデルの推論能力は、RLを通じて純粋にインセンティブを与えることで向上することが確認されました。これにより、将来的な研究の進展が期待されます。

DeepSeek-R1

モデルの蒸留（Distillation）と小型化

DeepSeek R1では、大規模モデルの推論パターンを小型モデルに蒸留（Distillation）することが可能であることが示されています。

これにより、小型モデルでも高い性能を発揮できることが証明され、研究コミュニティにとって有益なリソースとなります。さらに、DeepSeek R1から生成された推論データを用いて、さまざまな密なモデルがファインチューニングされ、優れたベンチマーク結果を達成しています。

評価結果と今後の展望

DeepSeek R1は、さまざまなベンチマークにおいて新たな最先端の結果を達成しています。特に、数学やコードの問題において高い正答率を示し、他のモデルと比較しても優れた性能を発揮しています。

今後は、さらに多くのデータを活用し、モデルの性能向上を目指すとともに、研究コミュニティへの貢献を続けていく予定です。

24時間365日のシステム運用監視サービス「JIG-SAW OPS」を提供する、JIG-SAW株式会社のOps Today編集部です。　サーバー運用監視実績50,000台の実績をもとに、システム運用監視に役立つ情報をお届けします！

この記事を含む特集

話題のニュースを深堀！

話題のニュースを深掘り！

人気の記事

【AIの雑学】Googleの「Gemini」って、ふたご座と関係あるの？名前の由来を調べてみた！

Tera Termの便利な使い方やコマンド【サーバ編】

GitHubの「あの猫」は日本に縁がある？Octocat誕生秘話と、デザインの話

【2025年10月最新】OpenAIの主要なモデル一覧 ─特徴や料金、利用方法など

Tera Termの便利な使い方やコマンド【ネットワーク編】

インフラ担当のクラウドエンジニアが作成する成果物を解説 ─「基本設計書」編