DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型。DeepSeek-R1采用强化学习进行后训练,旨在提升推理能力,尤其擅长数学、代码和自然语言推理等复杂任务。2024年11月20日,DeepSeek-R1-Lite预览版正式上线。2025年1月20日,幻方量化旗下AI公司深度求索(DeepSeek)正式发布DeepSeek-R1模型,并同步开源模型权重。2025年1月31日,DeepSeek R1 671b已作为英伟达NIM微服务预览版发布。
发展历程
2024年11月20日,DeepSeek宣布,全新研发的推理模型DeepSeek-R1-Lite预览版正式上线。该模型处于迭代开发阶段,仅支持网页使用,暂不支持API调用。
2025年1月20日,幻方量化旗下AI公司深度求索(DeepSeek)正式发布DeepSeek-R1模型,并同步开源模型权重。DeepSeek-R1 API 服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元。同年1月24日,DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三,与顶尖推理模型o1并列。1月26日消息,在短短一个月内,中国AI初创公司深度求索(DeepSeek)先后发布了DeepSeek-V3和DeepSeek-R1两款大模型,成本价格低廉,性能与OpenAI相当,让硅谷震惊,甚至引发了Meta内部的恐慌,工程师们开始连夜尝试复制DeepSeek的成果。1月27日,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
2025年1月31日,英伟达宣布,DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版提供。DeepSeek-R1 NIM 微服务可以在单个 NVIDIA HGX H200 系统上每秒提供多达 3,872 tokens。同日,DeepSeek R1 671b已作为英伟达NIM微服务预览版发布。
2025年1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIANIM。同一时段内,亚马逊和微软也接入DeepSeek-R1模型。英伟达称,DeepSeek-R1是最先进的大语言模型。
2025年2月2日,Gitee AI 宣布上线 DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B 四个较小尺寸的 DeepSeek 模型,本次上线的四个模型均部署在国产沐曦曦云 GPU 上。
2025年2月3日,秘塔科技宣布在秘塔AI搜索中集成“满血版”DeepSeek R1推理模型。同日消息,百度智能云千帆平台已正式上架DeepSeek-R1模型。同日,阿里云发文官宣,阿里云PAI Model Gallery支持云上一键部署DeepSeek-R1。
2025年2月4日,中科曙光国家先进计算产业创新中心有限公司昨日发文宣布,海光信息技术团队成功完成 DeepSeek V3 和 R1 模型与海光 DCU(深度计算单元)国产化适配,并正式上线。
2025年2月4日,万兴科技表示,已完成深度求索(DeepSeek)最新推理大模型DeepSeek-R1的深入适配,接入DeepSeek-R1后,用户使用产品的门槛降低,大模型应用的成本也进一步降低。2月4日,DeepSeek-R1正式上线昇腾社区。2月5日,华为纯血鸿蒙HarmonyOS NEXT的小艺助手App正式接入深度求索(DeepSeek)人工智能技术,其智能体广场同步上线DeepSeek-R1 Beta版本。2月5日,万兴科技在互动平台表示,公司已完成推理大模型DeepSeek-R1的适配,并落地融合相关能力于万兴喵影、亿图图示、亿图脑图MindMaster、万兴PDF等产品。2月5日,中国移动“移动云”宣布全面上线 DeepSeek,实现全版本覆盖、全尺寸适配、全功能畅用。2月6日,浙文互联官微消息,春节前浙文互联完成本地化部署DeepSeek-R1推理大模型。2月6日,网易有道正式宣布全面拥抱DeepSeek-R1。2月7日消息,出门问问宣布完成与DeepSeek-R1的深度适配。同月消息,搭载龙芯3号CPU的设备成功启动运行DeepSeek R1 7B模型,实现本地化部署。
模型功能
DeepSeek-R1-Lite预览版模型在美国数学竞赛(AMC)中难度等级最高的AIME以及全球顶级编程竞赛(codeforces)等评测中,超越了GPT-4o等模型。
DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
DeepSeek-R1的一大技术亮点在于其采用了大规模强化学习(RL)进行后训练。这项技术仅需少量标注数据,即可显著提升模型的性能,为大型语言模型的训练提供了新的思路。DeepSeek在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,通过DeepSeek-R1的输出,蒸馏了 6 个小模型开源给社区,其中 32B和 70B模型在多项能力上实现了对标OpenAI o1-mini的效果。
基本特点
性能卓越
DeepSeek-R1可媲美OpenAI-o1。在各种任务上都展现出了惊人的实力,尤其是在数学、代码和推理任务方面,其表现完全可以与OpenAI-o1比肩。
完全开源
DeepSeek-R1采用MIT许可协议,任何人都可以自由地使用、修改、分发和商业化该模型,包括模型权重和输出。
自主学习
DeepSeek-R1于构建了一个智能训练场,这一系统由三个技术组件构成:动态题目生成系统、过程验证体系和协同工作机制。用一个比喻来说,每解完一题,系统自动生成更难的变体题,并实时验证解题过程逻辑是否自洽。它迫使AI像数学家般提炼方法论,甚至能将几何证明中的反证法迁移到代码检测中。
赋能社区
除了DeepSeek-R1本身,研发团队还开源了6个从DeepSeek-R1蒸馏而来的小型模型。其中,32B和70B模型的性能同样可以与OpenAI-o1-mini相媲美。这些小型模型的开源,进一步降低了AI应用的门槛,让更多开发者可以参与到AI创新中来,极大地赋能了整个开源社区。
大模型排名
截至2025年1月27日,在世界大模型排名Arena上,DeepSeek-R1基准测试升至全类别大模型第三,其中,在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一。其竞技场得分达到1357分,略超OpenAI o1的1352分。
国际关注
2025年1月22日,美国媒体Business Insider报道称,DeepSeek-R1模型秉承开放精神,完全开源,为美国AI玩家带来了麻烦。
2025年1月24日,名投资公司A16z的创始人马克·安德森发文称,Deepseek-R1是他见过的最令人惊叹、最令人印象深刻的突破之一,而且还是开源的,它是给世界的一份礼物。
A16z合伙人、Mistral AI董事会成员Anjney Midha表示:“从斯坦福到麻省理工,DeepSeek-R1几乎一夜之间成为美国顶尖大学研究人员的首选模型。”
2025年1月27日,英国《金融时报》发表评论文章,文章指出,DeepSeek-R1模型的性能几乎可以媲美萨姆·奥尔特曼创立的OpenAI开发的模型,而成本仅为后者的零头。DeepSeek的突破挑战了人工智能发展的核心信念,即认为更强大的硬件才是推动人工智能发展的关键。1月27日晚,美国开放人工智能研究中心(OpenAI)首席执行官萨姆·奥尔特曼在社交媒体平台X上发文,对DeepSeek-R1模型首次亮相表示欢迎。
2025年1月30日消息,微软CEO纳德拉在电话会上强调,DeepSeek R1模型目前已可通过微软的AI平台Azure AI Foundry和GitHub获取,并且很快就能在Copilot+电脑上运行。纳德拉称DeepSeek“有一些真的创新”,AI成本下降是趋势:“缩放定律(Scaling Law)在预训练和推理时间计算中不断积累。多年来,我们已经看到了AI训练和推理方面的效率显著提高。在推理方面,我们通常看到每一代硬件的性价比提高2倍以上,每一代模型的性价比提高10倍以上。”
相关评价
DeepSeek从V3到R1,将进一步推动全行业大模型的提升,更快地追赶GPT-4o和GPT-o1;同时成本的下降,有助于AI应用和AI终端的普及。(华泰证券研报 评)
中国人工智能初创公司DeepSeek的崛起应当为美国企业敲响“警钟”,美国公司“需要专注于竞争以赢得胜利。DeepSeek崛起也可能传递了一种积极信号。(美国总统特朗普 评)
中国DeepSeek AI模型超越了美国,中国科学家在人工智能(AI)领域取得的成就,以及包括DeepSeek的出现,超越了美国相关研发人员在该领域的成果。(俄罗斯外交部长拉夫罗夫 评)
DeepSeek-R1是一款使人印象深刻的模型,尤其是考虑到它能够以这个价格提供这样的产品。有这样的新竞争对手确实令人振奋。(美国开放人工智能研究中心首席执行官萨姆·奥尔特曼 评)
DeepSeek的最新人工智能(AI)模型有可能重塑产业格局,并预测说,“这是一个新的冲击”。(韩国代理总统崔相穆 评)