AI实力榜大洗牌！OpenAI谷歌强势领跑，Anthropic节节败退

美羊羊3个月前 (05-18)教育资讯31

最近，Poe发布了最新的使用报告，报告显示，OpenAI和谷歌的地位越来越稳，势头很猛。

Anthropic就没那么好运，有点掉队了。

AI模型的推理能力，已经成为了各大公司竞争的关键战场。

根据Poe发布的数据，2025年1月到5月这段时间，AI各个主要领域，市场份额都重新洗牌了。

主要结果如下：

谷歌用什么节点__谷歌杰哥

截至2025年5月不同类别的AI模型排名

o3驱动的智能体拔得头筹，Claude和Gemini紧随其后。

谷歌杰哥_谷歌用什么节点_

文本：

GPT-4o稳坐头把交椅，新模型来势汹汹

在文本生成这个领域，OpenAI的GPT-4o是稳稳的第一，用户占比达到35.8%，占据主导地位。

OpenAI新出的GPT-4.1系列也不容小觑，发布没几周，就拿下了9.4%的份额。

谷歌的Gemini 2.5 Pro表现也不错，刚上线不久，就有大约5%的用户选择它。

谷歌杰哥__谷歌用什么节点

不过，Anthropic的Claude可就有点惨了，这段时间它的市场份额下降了10%，被OpenAI和谷歌抢走了不少用户。

虽说现在Claude 3.7 Sonnet更受大家欢迎，取代了Claude 3.5 Sonnet，但老版本也还有12%的人在用。

还有DeepSeek，今年年初一炮而红。后来其他公司也推出了不少价格实惠、功能又强的推理模型。

DeepSeek R1的用户占比从2月中旬7%的最高点，下跌到4月底，只剩3%了。

推理：

会解难题成了「制胜法宝」

专门用来推理的模型越来越受欢迎了。

2025年年初开始，推理模型的比例从2%一下子涨到了10%。

谷歌用什么节点_谷歌杰哥_

Nick Huber表示，这些推理模型别看还在发展初期，但解决复杂问题的能力特别强，给出的答案也更准确。那些喜欢尝鲜的用户发现了它的好处，就算用的时候成本高一点、花的时间长一点，他们也愿意，就为了能得到更好的结果。

在推理模型这个热门领域，谷歌的Gemini 2.5 Pro一骑绝尘。

上线才六周，就占了31%的市场份额，把Claude那些专门做推理的模型都比下去了。

谷歌用什么节点_谷歌杰哥_

OpenAI在推理模型方面一直在创新。2025年前4个月，就推出了好多款新的推理模型，像o1-pro、o3-mini。

Poe的用户特别愿意尝试OpenAI的新模型，很快就从老版本换成新版本了。

还出现了一些新的混合推理模型，像Gemini 2.5 Flash Preview和Qwen 3，它们能在聊天的时候根据情况调整推理的深度。

不过目前用这些新模型的用户还不多，只占推理模型用户总数的1%左右。

有行业分析师就说了，现在大家都在卷推理能力，这说明AI市场在慢慢成熟。

基础的文本生成功能已经没什么差异化了，想脱颖而出，就得靠这种更高级的能力。

图像：

谷歌Imagen 3「搅局」

图像生成这个领域现在也是竞争白热化。

谷歌的Imagen 3系列模型一路逆袭，2025年市场份额从10%左右涨到了30%，已经能和黑森林实验室的FLUX系列模型「掰掰手腕」了。

到4月下旬，FLUX系列模型的市场份额也就35%左右。

OpenAI的GPT-Image-1也不甘示弱，4月下旬刚接入API，才过了两周，就有17%的用户用它来生成图像了，和它之前在ChatGPT里爆火的情况差不多。

虽然FLUX系列模型在Poe的图像生成领域还是用的人最多，但从数据上也能看出，它的市场份额从45%掉到35%了，被谷歌和OpenAI抢了不少用户。

以前图像生成是Midjourney和Stable Diffusion的天下，现在谷歌、OpenAI和黑森林实验室三足鼎立，竞争特别激烈。

现在图像生成的质量越来越好，对用户给的提示理解得更准，生成速度也更快，已经成为竞争最激烈的战场之一了。

从行业数据能看出，最近这半年，企业对图像生成技术的需求暴增。好多公司的营销部门还有创意机构，都开始用这些技术做设计了。

视频：黑马Kling搅局

在视频生成领域，中国快手实验室新出的Kling系列模型就像一匹黑马，直接拿下了30%左右的市场份额。

其中Kling-2.0-Master最厉害，4月底发布，才过了三周，在Poe上的使用占比就达到21%了。

谷歌用什么节点__谷歌杰哥

谷歌的Veo2自从2月发布以来，一直保持着20%左右的份额，表现挺稳定。

但这个领域最早的开拓者Runway就没那么幸运了，在报告期里，它的市场份额从60%大幅下降到20%。

Kling系列能这么快打开市场，说明在新兴的AI领域，就算是一开始领先的公司，如果不持续进步，很快就会被新公司超越。

视频生成特别耗性能，哪怕生成一小段视频，也得需要很强的处理能力。所以和文本、图像生成比起来，用视频生成模型的人相对少一些。

不过现在技术发展快，成本在下降，视频质量在提高，估计2025年用的人会越来越多。

现在已经有不少广告公司、社交媒体博主还有教育平台开始用AI生成视频了，虽然这项技术还有些不足，但大家都看到了它的潜力。

语音：

ElevenLabs称霸，新公司另辟蹊径

在语音领域，ElevenLabs还是稳稳的王者，报告期内，差不多80%的用户都用它来做文本转语音。

不过，Cartesia、Unreal Speech 这些新公司也来分蛋糕了，它们提供了很多不一样的语音选择，还有各种音效，价格也各有优势。

_谷歌杰哥_谷歌用什么节点

和其他领域的竞争很分散不同，语音AI基本被ElevenLabs垄断了。

专家分析，这是因为它进入市场早，语音库特别丰富，而且一直都在优化，技术比其他公司厉害。

新公司也有自己的办法，它们不跟ElevenLabs正面硬刚，而是找一些细分市场。

比如Unreal Speech就专门给播客和有声书制作方提供服务，能模拟各种专业配音演员的声音，还能表现出不同的情感。

Cartesia则主打多语言、带真实口音的语音，受到很多跨国企业和教育平台的欢迎。

随着文本转语音技术越来越成熟，越来越接近真人说话的水平，在客服、无障碍服务，还有内容创作这些场景用得越来越多。

语音AI对性能要求不高，用起来更方便，预计2025年这个市场还会继续扩大。

o3智能体拔得头筹

在一项针对AI智能体的联网研究测试中，ChatGPT最新的o3模型战胜了Anthropic的Claude和谷歌的Gemini。

不过话说回来，最牛的智能体和人类专家相比，还是有不小的差距。

_谷歌用什么节点_谷歌杰哥

FutureSearch让11个主流的大模型完成了总共89项实际研究任务，并对每个模型在查找原始资料来源、搜寻数据、收集证据、汇编数据以及验证主张等能力进行了评估。

最后打分结果出来，最高分才0.51，而满分预计是0.8。

也就是说，现在最牛的AI智能体，专业研究人员花点时间，也能轻松「碾压」它们。

这次测评的成绩单如下：

对比去年GPT-4 Turbo才0.27的分数，在一年时间里，优秀通才研究人员和前沿智能体之间的差距缩小了约45%。

此外，像DeepSeek这样价格便宜的智能体，与来自OpenAI的付费高端产品相比，差距并不大。

OpenAI的o3暂时领跑，Claude和Gemini紧跟其后。

目前看来，闭源模型在搞研究这块更有优势，但开源模型也在疯狂上分。

不过智能体的「短板」也很明显。

跟人类研究员相比，它们在战略规划、全面性、评估资料来源质量等方面更逊一筹，还特别容易忘事，任务做到一半就把之前查到的东西抛脑后了。

更要命的是，好多AI都有「摆烂」倾向，找到差不多能用的答案就收手，不愿意再深挖找更好的。

ChatGPT的o3能拿第一，就是因为它更较真，验证答案特别仔细，也不会轻易放过更好的解决方案。

照这趋势，说不定过不了几年AI就能反超人类研究员了。

不过最近，ChatGPT新版本还因为太过谄媚被吐槽过。AI要想稳定变强，还有很长的路要走。

现在AI智能体给出的结果，还是得自己再检查一遍，可别偷懒直接抄作业！

企业如何应对快速变化的AI市场？

AI市场变得这么快，对那些想用AI的企业来说，既是机会也是挑战。

已经在大规模用AI的企业，要建立一套靠谱的评估体系，别只盯着一家供应商。因为说不定这个月最好用的模型，下个月就不是了。

推理能力越来越重要，以前可能更看重速度和成本，现在大家更关注处理复杂任务时准不准、靠不靠谱。

现在前沿的AI公司不停地推出更厉害的模型，企业很纠结：到底是选定一个平台长期用，还是保持灵活性？

很多企业的AI负责人都选择两手抓，不同的任务用不同的模型，一旦有更好的技术出现，马上就能切换。

从报告里能看出，现在图像、视频、音频这些多媒体相关的AI能力竞争也很激烈。

以后可能得更注重发展一个全面、平衡的AI生态系统，图像、视频、音频生成和文本生成等都很重要。

对企业来说，如果想在AI浪潮里站稳脚跟，最好根据自己的实际需求去挑选AI模型，别盲目追新。

同时，企业也要搭建好技术框架，这样一旦有更好的技术出现，就能马上用起来。

那些只守着过去的AI明星产品的公司，说不定很快就会被市场淘汰。

参考资料：

标签: AI实力榜 OpenAI 谷歌市场份额 AI模型

返回列表

上一篇：乐观本身就是一种成功，因为乐观代表孩子心理健康，而心理健康是人生幸福的关键

下一篇：并非王楚钦，官宣喜讯，陈梦发声，做出决定，父母期待

OpenAI伏击苹果

近日，一份OpenAI的内部文件因美国司法部对谷歌正在进行的反垄断诉讼而意外曝光，向世人展示了OpenAI的战略蓝图。这份名为“ChatGPT：2025年上半年战略”（ChatGPT:H1 202...

ChatGPT新增购物推荐功能 OpenAI强调这不是广告

4月29日消息，美国时间周一，OpenAI宣布正在为ChatGPT推出内置购物功能，包含产品推荐和购买按钮。这一功能将覆盖AI搜索查询，面向所有用户开放，无需登录即可使用。不过，用户无法在ChatG...

OpenAI开源两款大模型：性能超DeepSeek，但“幻觉”频发

8月6日消息，OpenAI周二宣布了一项重大战略转变，将免费“开源”旗下两款人工智能模型——gpt-oss-120b和gpt-oss-20b。此举被视为对DeepSeek等竞争对手在开源领域积极布局的...

股权薪酬占营收119%：OpenAI为留住人才付出高昂代价

媒体消息显示，OpenAI因应激烈的人工智能（AI）领域人才争夺战而大幅提升员工薪酬，其股权激励成本已达到惊人水平，让现有投资者面临营利性子公司重组后股权进一步被稀释的威胁。据美东时间7月7日周一的...

OpenAI似乎步子迈太大了

当地时间5月29日，据外媒报道，特拉华州总检察长计划聘请一家投资银行为其办公室提供咨询，以审查OpenAI旨在吸引投资者的重组计划。看来，这家引领AI行业发展的公司尚处于自身结构转变的阵痛之中。而...

OpenAI官宣最强模型o3-pro！号称写作、编程更准

6月11日消息，据Techcrunch报道，OpenAI发布了o3-pro，这一AI模型被公司称为迄今为止最强大的产品。 o3-pro是OpenAI今年早些时候推出的推理模型o3的一个版本。与传统AI...

发表评论

客服微信：hnyanshan点击复制并跳转微信

录取吧