DeepSeek终于更新,但R2可能遥遥无期?

美羊羊2天前教育资讯4

大家期待的R2模型没来,但DeepSeek官方正式发布了新模型V3.1!看来,这并非一次大的更新,而更像是一次小步调的版本迭代。

DeepSeek终于更新,但R2可能遥遥无期?_DeepSeek终于更新,但R2可能遥遥无期?_

有何亮点?

根据DeepSeek在其官方微信群中发布的一条帖子,V3.1上下文长度拓展至128K,这意味着它可以针对任何给定的查询考虑更大量的信息。

例如,这可以让它维持更长时间的对话并获得更好的回忆率。目前官方网页、App、小程序测试、API接口调用方式,保持不变。

本次升级主要放阔三方面的升级变化:

混合推理架构:一个模型同时支持思考模式与非思考模式;

更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;

更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

此外,在思考效率上,新模式也进一步得到了提升,体现在更少Token,相同表现之上。

根据其测试结果,经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。

同时,V3.1在非思考模式下的输出长度也得到了有效控制,能够在输出长度明显减少的情况下保持相同的模型性能。

国外的人工智能研究员安德鲁·克里斯蒂安森(Andrew Christianson)在推特上写道:“Deepseekv3.1在辅助工具(非推理性SOTA)上的得分为71.6%,比Claude Opus 1高出4%,同时便宜68倍”。这一成就使DeepSeek跻身稀有公司,与以前为最昂贵的专有系统保留的性能水平相匹配。

与此同时,DeepSeek进行了价格调整,模型的API接口调用价格有所上涨。自9月6日凌晨起,取消夜间时段优惠,输入价格上,缓存命中时为0.5元/百万tokens,缓存未命中的价格则为4元/百万tokens(此前V3为2元/百万tokens);输出价格为12元/百万tokens(此前V3为8元/百万tokens)。

DeepSeek终于更新,但R2可能遥遥无期?_DeepSeek终于更新,但R2可能遥遥无期?_

R2可能遥遥无期?

今年1月,伴随DeepSeek R1发布并迅速引发各界关注,业界对DeepSeek的推崇与好感度迅速提升。在DeepSeek R1发布当月,DeepSeek网页及App用户增长达1.25亿(含网站和应用累加),其中80%以上用户来自1月最后一周。至今年1月28日,DeepSeek日活跃用户数(DAU)首次超越豆包,成为全球增速最快的AI应用之一。

很快,其主动开放源代码的做法,也让业界开始借鉴或直接将DeepSeek满血版集成到自己应用上,腾讯元宝、百度、360等新产品应运而生。

紧接着,各大厂商上演了“车轮战”,众人将R1作为是否成功的参照物。

国内方面,阿里巴巴旗下Qwen基本保持了每月一大发布,两周一小发布的频率,高频发布全尺寸、多模态模型。阿里上个月发布的千问3旗舰模型Qwen3-235B-A22B,声称在核心能力测评中,比肩Gemini-2.5 pro、o4-mini等顶尖闭源模型,并超越了DeepSeek R1。

遗憾的是,此次V3.1更新,虽然在用户体验和经济性上带来了一些惊喜,但业界备受关注的新一代R2模型并未出现。

接近DeepSeek人士曾透露,“DeepSeek-R2在8月内并无发布计划。”这或许意味着,V3.1模型更新后,8月或将不会有更大版本的DeepSeek新模型发布。

相关文章

边缘AI赛道,疯狂收购

边缘AI赛道,疯狂收购

前几日,意法半导体(ST)收购加拿大AI初创公司Deeplite的消息引发行业关注。 Deeplite号称边缘AI的DeepSeek,该公司在模型优化、量化和压缩方面有独特技术,可使AI大模型在边缘设...

美版“梁文锋”不信邪

美版“梁文锋”不信邪

在最近,Harmonic最新推出的Chatbot式应用程序的一波宣传攻势中,两位创始人声称Aristotle做数学推理问题时给出的答案完全“无幻觉”。 此外,Harmonic还计划发布一个to B的A...

DeepSeek流量暴跌?AI大模型全球霸主离奇遇冷,外媒曝出真相

DeepSeek流量暴跌?AI大模型全球霸主离奇遇冷,外媒曝出真相

最近,全世界的大厂都在蠢蠢欲动了! GPT-5、Grok 4,甚至Claude,都已经纷纷有了消息,一场恶战仿佛就在眼前! DeepSeek这边,似乎也有新动静了。 就在昨天,一个疑似DeepSee...

美版“梁文锋”不信邪

美版“梁文锋”不信邪

在最近,Harmonic最新推出的Chatbot式应用程序的一波宣传攻势中,两位创始人声称Aristotle做数学推理问题时给出的答案完全“无幻觉”。 此外,Harmonic还计划发布一个to B的A...

梁文锋和杨植麟再“撞车”

梁文锋和杨植麟再“撞车”

被追赶和超越,是创业者常面对的挑战。 文|《中国企业家》记者 闫俊文 编辑|张晓迪 图片来源|视觉中国 继2月论文“撞车”之后,梁文锋和杨植麟又在另一个大模型赛道上相遇了。 4月30日,DeepSe...

DeepSeek:学霸最多的省份

DeepSeek:学霸最多的省份

1. 江苏省 特点:高考难度(尤其过去的“地狱模式”江苏卷)闻名全国,题目灵活、区分度高。基础教育极其扎实,尤其是苏南地区(南京、苏州、无锡、常州)。顶尖高中林立(如南外、南师附中、天一中学等),学...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
客服微信:hnyanshan点击复制并跳转微信