DeepSeek终于更新,但R2可能遥遥无期?
大家期待的R2模型没来,但DeepSeek官方正式发布了新模型V3.1!看来,这并非一次大的更新,而更像是一次小步调的版本迭代。
有何亮点?
根据DeepSeek在其官方微信群中发布的一条帖子,V3.1上下文长度拓展至128K,这意味着它可以针对任何给定的查询考虑更大量的信息。
例如,这可以让它维持更长时间的对话并获得更好的回忆率。目前官方网页、App、小程序测试、API接口调用方式,保持不变。
本次升级主要放阔三方面的升级变化:
混合推理架构:一个模型同时支持思考模式与非思考模式;
更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;
更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。
此外,在思考效率上,新模式也进一步得到了提升,体现在更少Token,相同表现之上。
根据其测试结果,经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。
同时,V3.1在非思考模式下的输出长度也得到了有效控制,能够在输出长度明显减少的情况下保持相同的模型性能。
国外的人工智能研究员安德鲁·克里斯蒂安森(Andrew Christianson)在推特上写道:“Deepseekv3.1在辅助工具(非推理性SOTA)上的得分为71.6%,比Claude Opus 1高出4%,同时便宜68倍”。这一成就使DeepSeek跻身稀有公司,与以前为最昂贵的专有系统保留的性能水平相匹配。
与此同时,DeepSeek进行了价格调整,模型的API接口调用价格有所上涨。自9月6日凌晨起,取消夜间时段优惠,输入价格上,缓存命中时为0.5元/百万tokens,缓存未命中的价格则为4元/百万tokens(此前V3为2元/百万tokens);输出价格为12元/百万tokens(此前V3为8元/百万tokens)。
R2可能遥遥无期?
今年1月,伴随DeepSeek R1发布并迅速引发各界关注,业界对DeepSeek的推崇与好感度迅速提升。在DeepSeek R1发布当月,DeepSeek网页及App用户增长达1.25亿(含网站和应用累加),其中80%以上用户来自1月最后一周。至今年1月28日,DeepSeek日活跃用户数(DAU)首次超越豆包,成为全球增速最快的AI应用之一。
很快,其主动开放源代码的做法,也让业界开始借鉴或直接将DeepSeek满血版集成到自己应用上,腾讯元宝、百度、360等新产品应运而生。
紧接着,各大厂商上演了“车轮战”,众人将R1作为是否成功的参照物。
国内方面,阿里巴巴旗下Qwen基本保持了每月一大发布,两周一小发布的频率,高频发布全尺寸、多模态模型。阿里上个月发布的千问3旗舰模型Qwen3-235B-A22B,声称在核心能力测评中,比肩Gemini-2.5 pro、o4-mini等顶尖闭源模型,并超越了DeepSeek R1。
遗憾的是,此次V3.1更新,虽然在用户体验和经济性上带来了一些惊喜,但业界备受关注的新一代R2模型并未出现。
接近DeepSeek人士曾透露,“DeepSeek-R2在8月内并无发布计划。”这或许意味着,V3.1模型更新后,8月或将不会有更大版本的DeepSeek新模型发布。