DeepSeek-R1

DeepSeek2025年1月发布的模型

DeepSeek-R1，是幻方量化旗下AI公司深度求索（DeepSeek）研发的推理模型。DeepSeek-R1采用强化学习进行后训练，旨在提升推理能力，尤其擅长数学、代码和自然语言推理等复杂任务。2024年11月20日，DeepSeek-R1-Lite预览版正式上线。2025年1月20日，幻方量化旗下AI公司深度求索（DeepSeek）正式发布DeepSeek-R1模型，并同步开源模型权重。2025年1月31日，DeepSeek R1 671b已作为英伟达NIM微服务预览版发布。

发展历程

2024年11月20日，DeepSeek宣布，全新研发的推理模型DeepSeek-R1-Lite预览版正式上线。该模型处于迭代开发阶段，仅支持网页使用，暂不支持API调用。

2025年1月20日，幻方量化旗下AI公司深度求索（DeepSeek）正式发布DeepSeek-R1模型，并同步开源模型权重。DeepSeek-R1 API 服务定价为每百万输入tokens1元（缓存命中）/4元（缓存未命中），每百万输出tokens16元。同年1月24日，DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三，与顶尖推理模型o1并列。1月26日消息，在短短一个月内，中国AI初创公司深度求索（DeepSeek）先后发布了DeepSeek-V3和DeepSeek-R1两款大模型，成本价格低廉，性能与OpenAI相当，让硅谷震惊，甚至引发了Meta内部的恐慌，工程师们开始连夜尝试复制DeepSeek的成果。1月27日，DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜，在美区下载榜上超越了ChatGPT。

2025年1月31日，英伟达宣布，DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版提供。DeepSeek-R1 NIM 微服务可以在单个 NVIDIA HGX H200 系统上每秒提供多达 3,872 tokens。同日，DeepSeek R1 671b已作为英伟达NIM微服务预览版发布。

2025年1月31日，英伟达宣布DeepSeek-R1模型登陆NVIDIANIM。同一时段内，亚马逊和微软也接入DeepSeek-R1模型。英伟达称，DeepSeek-R1是最先进的大语言模型。

2025年2月2日，Gitee AI 宣布上线 DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B 四个较小尺寸的 DeepSeek 模型，本次上线的四个模型均部署在国产沐曦曦云 GPU 上。

2025年2月3日，秘塔科技宣布在秘塔AI搜索中集成“满血版”DeepSeek R1推理模型。同日消息，百度智能云千帆平台已正式上架DeepSeek-R1模型。同日，阿里云发文官宣，阿里云PAI Model Gallery支持云上一键部署DeepSeek-R1。

2025年2月4日，中科曙光国家先进计算产业创新中心有限公司昨日发文宣布，海光信息技术团队成功完成 DeepSeek V3 和 R1 模型与海光 DCU（深度计算单元）国产化适配，并正式上线。

2025年2月4日，万兴科技表示，已完成深度求索（DeepSeek）最新推理大模型DeepSeek-R1的深入适配，接入DeepSeek-R1后，用户使用产品的门槛降低，大模型应用的成本也进一步降低。2月4日，DeepSeek-R1正式上线昇腾社区。2月5日，华为纯血鸿蒙HarmonyOS NEXT的小艺助手App正式接入深度求索（DeepSeek）人工智能技术，其智能体广场同步上线DeepSeek-R1 Beta版本。2月5日，万兴科技在互动平台表示，公司已完成推理大模型DeepSeek-R1的适配，并落地融合相关能力于万兴喵影、亿图图示、亿图脑图MindMaster、万兴PDF等产品。2月5日，中国移动“移动云”宣布全面上线 DeepSeek，实现全版本覆盖、全尺寸适配、全功能畅用。2月6日，浙文互联官微消息，春节前浙文互联完成本地化部署DeepSeek-R1推理大模型。2月6日，网易有道正式宣布全面拥抱DeepSeek-R1。2月7日消息，出门问问宣布完成与DeepSeek-R1的深度适配。同月消息，搭载龙芯3号CPU的设备成功启动运行DeepSeek R1 7B模型，实现本地化部署。

模型功能

DeepSeek-R1-Lite预览版模型在美国数学竞赛（AMC）中难度等级最高的AIME以及全球顶级编程竞赛（codeforces）等评测中，超越了GPT-4o等模型。

DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。

DeepSeek-R1的一大技术亮点在于其采用了大规模强化学习(RL)进行后训练。这项技术仅需少量标注数据，即可显著提升模型的性能，为大型语言模型的训练提供了新的思路。DeepSeek在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时，通过DeepSeek-R1的输出，蒸馏了 6 个小模型开源给社区，其中 32B和 70B模型在多项能力上实现了对标OpenAI o1-mini的效果。

基本特点

性能卓越

DeepSeek-R1可媲美OpenAI-o1。在各种任务上都展现出了惊人的实力，尤其是在数学、代码和推理任务方面，其表现完全可以与OpenAI-o1比肩。

完全开源

DeepSeek-R1采用MIT许可协议，任何人都可以自由地使用、修改、分发和商业化该模型，包括模型权重和输出。

自主学习

DeepSeek-R1于构建了一个智能训练场，这一系统由三个技术组件构成：动态题目生成系统、过程验证体系和协同工作机制。用一个比喻来说，每解完一题，系统自动生成更难的变体题，并实时验证解题过程逻辑是否自洽。它迫使AI像数学家般提炼方法论，甚至能将几何证明中的反证法迁移到代码检测中。

赋能社区

除了DeepSeek-R1本身，研发团队还开源了6个从DeepSeek-R1蒸馏而来的小型模型。其中，32B和70B模型的性能同样可以与OpenAI-o1-mini相媲美。这些小型模型的开源，进一步降低了AI应用的门槛，让更多开发者可以参与到AI创新中来，极大地赋能了整个开源社区。

大模型排名

截至2025年1月27日，在世界大模型排名Arena上，DeepSeek-R1基准测试升至全类别大模型第三，其中，在风格控制类模型（StyleCtrl）分类中与OpenAI o1并列第一。其竞技场得分达到1357分，略超OpenAI o1的1352分。

国际关注

2025年1月22日，美国媒体Business Insider报道称，DeepSeek-R1模型秉承开放精神，完全开源，为美国AI玩家带来了麻烦。

2025年1月24日，名投资公司A16z的创始人马克·安德森发文称，Deepseek-R1是他见过的最令人惊叹、最令人印象深刻的突破之一，而且还是开源的，它是给世界的一份礼物。

A16z合伙人、Mistral AI董事会成员Anjney Midha表示：“从斯坦福到麻省理工，DeepSeek-R1几乎一夜之间成为美国顶尖大学研究人员的首选模型。”

2025年1月27日，英国《金融时报》发表评论文章，文章指出，DeepSeek-R1模型的性能几乎可以媲美萨姆·奥尔特曼创立的OpenAI开发的模型，而成本仅为后者的零头。DeepSeek的突破挑战了人工智能发展的核心信念，即认为更强大的硬件才是推动人工智能发展的关键。1月27日晚，美国开放人工智能研究中心（OpenAI）首席执行官萨姆·奥尔特曼在社交媒体平台X上发文，对DeepSeek-R1模型首次亮相表示欢迎。

2025年1月30日消息，微软CEO纳德拉在电话会上强调，DeepSeek R1模型目前已可通过微软的AI平台Azure AI Foundry和GitHub获取，并且很快就能在Copilot+电脑上运行。纳德拉称DeepSeek“有一些真的创新”，AI成本下降是趋势：“缩放定律（Scaling Law）在预训练和推理时间计算中不断积累。多年来，我们已经看到了AI训练和推理方面的效率显著提高。在推理方面，我们通常看到每一代硬件的性价比提高2倍以上，每一代模型的性价比提高10倍以上。”