OpenAI官宣最强模型o3-pro!号称写作、编程更准

美羊羊2个月前教育资讯34

6月11日消息,据Techcrunch报道,OpenAI发布了o3-pro,这一AI模型被公司称为迄今为止最强大的产品。

o3-pro是OpenAI今年早些时候推出的推理模型o3的一个版本。与传统AI模型不同,推理模型能够逐步推理解决问题,因此在物理、数学和编程等领域表现更为可靠。

自本周二起,o3-pro已面向ChatGPT Pro和Team用户开放,取代原有的o1-pro模型。OpenAI表示,企业版与教育版用户将在下周获得访问权限。o3-pro也已于今日上线OpenAI的开发者API。

在API中,o3-pro的定价为每百万输入tokens 20美元,每百万输出tokens 80美元。输入tokens指输入到模型中的内容,输出tokens则是模型基于输入生成的内容。

一百万输入tokens大约相当于75万字,略长于《战争与和平》。

OpenAI官宣最强模型o3-pro!号称写作、编程更准

OpenAI在更新日志中写道:“在专家评测中,评审人员在所有测试类别中均更倾向于o3-pro,尤其是在科学、教育、编程、商务和写作辅助等关键领域。评审人员还一致认为,o3-pro在表达清晰度、内容全面性、指令遵循度和准确性等方面表现更优。”

根据OpenAI介绍,o3-pro具备多项工具调用能力,可实现网页搜索、文件分析、图像内容推理、使用Python、借助记忆进行个性化响应等。不过,OpenAI也指出,相较于o1-pro,o3-pro生成回复所需时间通常更长。

o3-pro还存在其他限制。目前,ChatGPT中的临时对话功能暂时关闭,OpenAI正在解决相关技术问题。o3-pro不支持图像生成,也无法用于“画布”(Canvas)这一AI智能工作区功能。

值得一提的是,OpenAI内部测试显示,o3-pro在多项主流AI基准测试中取得了优异成绩。在AIME 2024数学能力评测中,o3-pro得分高于谷歌的旗舰AI模型Gemini 2.5 Pro。在GPQA Diamond(博士级科学知识测试)中,o3-pro也超越了Anthropic近期发布的Claude 4 Opus。(易句)

(本文由AI翻译,网易编辑负责校对)

准一级动力学模型__准三维模型

相关文章

奥特曼首晒GPT-5实测!被曝使用超级对齐团队“遗产”

奥特曼首晒GPT-5实测!被曝使用超级对齐团队“遗产”

鱼羊 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI GPT-5,终于亮出真容! 最新实测,由奥特曼本人带来,迅速引发大量围观。 疯狂暗示了一周之后,虽说对话只是围绕电视剧推荐,但好歹是有官方...

OpenAI伏击苹果

OpenAI伏击苹果

近日,一份OpenAI的内部文件因美国司法部对谷歌正在进行的反垄断诉讼而意外曝光,向世人展示了OpenAI的战略蓝图。 这份名为“ChatGPT:2025年上半年战略”(ChatGPT:H1 202...

刚刚,GPT-5 正式发布!奥特曼:这是全球最好的模型

刚刚,GPT-5 正式发布!奥特曼:这是全球最好的模型

刚刚,OpenAI 正式发布了 GPT-5。 CEO Sam Altman 在发布会表示 ,GPT-5 是全球最佳模型。 OpenAI 认为这不是一次简单的升级,而是一次智能的「次元跳跃」。 官方宣...

OpenAI最新技术报告:GPT-4o变谄媚的原因万万没想到

OpenAI最新技术报告:GPT-4o变谄媚的原因万万没想到

GPT-4o更新后“变谄媚”?后续技术报告来了。 OpenAI一篇新鲜出炉的认错小作文,直接引来上百万网友围观。 CEO奥特曼也做足姿态,第一时间转发小作文并表示: 概括而言,最新报告提到,大约一...

OpenAI伏击苹果

OpenAI伏击苹果

近日,一份OpenAI的内部文件因美国司法部对谷歌正在进行的反垄断诉讼而意外曝光,向世人展示了OpenAI的战略蓝图。 这份名为“ChatGPT:2025年上半年战略”(ChatGPT:H1 202...

IMO怒斥OpenAI自封夺金,“91位评委均未参与评分”

IMO怒斥OpenAI自封夺金,“91位评委均未参与评分”

梦晨 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI OpenAI声称新模型获得IMO金牌不到24小时,剧情就出现了大反转! 多位IMO官方人士和学界大佬纷纷发声,直指OpenAI的做法“粗鲁且...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
客服微信:hnyanshan点击复制并跳转微信