美版“梁文锋”不信邪

美羊羊2周前教育资讯6

在最近,Harmonic最新推出的Chatbot式应用程序的一波宣传攻势中,两位创始人声称Aristotle做数学推理问题时给出的答案完全“无幻觉”。 此外,Harmonic还计划发布一个to B的API以让企业可以访问,以及一个面向消费者的网络应用程序。

两年估值接近9亿美元

Harmonic自成立以来,就受到了投资界的热烈追捧,短短两年内就完成了多轮大额融资。

从融资时机来看,Harmonic踩得很准,2024年,OpenAI推出了新模型,虽然展现了一定的数学能力,但还是会犯错,幻觉率仍居高不下。

这让整个行业开始意识到"AI需要更严谨的推理能力",正好给Harmonic这样的公司创造了机会。

A轮融资时,投资方大多有学术或技术背景,他们看好Harmonic在学术上的突破。

进入2025年,AI行业竞争越来越激烈,各大公司都在抢着布局更强的多模态和推理AI。特别是DeepMind在2024年底推出的AlphaProof取得成功,更是引发了市场对"AI证明"这个领域的关注。

Harmonic在此时又适时开始融资B轮,正值整个行业寻求将AI从“能用”到“可用”的节点。

根据公开信息,Harmonic的种子阶段由联合创始人Vlad Tenev个人和天使投资人提供启动资金,主要用来组建团队和开展基础研究。

A轮融资在2024年9月完成,拿到7500万美元,公司估值达到3.25亿美元。B轮融资于2025年7月宣布,又融了1亿美元,公司估值接近9亿美元,离10亿美元大关仅差一小步。

美版“梁文锋”不信邪__美版“梁文锋”不信邪

Harmonic的融资图

Harmonic的投资人阵容相当亮眼,既有顶级硅谷投资机构,也有行业基金和学术背景的资本,不仅有传统的顶级风投,还有新兴的科技基金。

例如其A轮由硅谷知名的红杉资本(Sequoia Capital)领投,欧洲著名的Index Ventures紧跟其后。

同时,多家国际基金和知名个人也参与投资。B轮融资则由老牌投资机构Kleiner Perkins领投,专注加密和前沿科技的Paradigm大手笔跟投。红杉和Index作为老投资者继续投钱,金融科技投资机构Ribbit Capital新加入。此外,Quora联合创始人查理·切沃(Charlie Cheever)也以个人身份参与了B轮。

一个叫做“Lean”的超级“数学监理”

Harmonic究竟做了什么解决AI在数学推理上的瓶颈?

这要从数学界正在发生一些有趣的变化说起。

越来越多的数学家开始使用一种叫Lean的工具来写数学证明,这是一个由微软研究院开发的交互式定理证明系统,它能结合数学证明和编程的系统,能用代码形式精确地表达并验证复杂的数学理论,这成为了Harmonic的技术核心。

在Lean之前,大模型写数学证明的时候,幻觉往往表现在,看起来似乎说得头头是道,但往往会出现中间某一步是“AI觉得对”。

Lean则相当于一个数字化的超级监理和3D打印机器人。

每写下一行代码,它就立刻像监理一样,用激光尺、钢筋扫描仪(形式化逻辑规则)分毫不差地检查一遍。只要发现缺了一根钉子、少了一块砖,它马上红灯报警,并要求返工。一旦全部绿灯,Lean会把整个证明自动“3D打印”出来——生成一个机器可检验、不可篡改的完整证明档案。

Harmonic的产品,正是基于Lean的工具,以减少AI在数学上的幻觉。这条路线,需要大量已被人工标注或是验证好的Lean的数据。Harmonic声称他们可以通过数据自动形式化的方式,解决人工和数据收集方面的问题。当然,这背后有极其复杂的技术建构。

简单理解就是,在数学里,一句简单的“显然成立”,在Lean的代码逻辑下,可能要拆成50条逻辑规则,少一条都不行,就像是给乐高城堡补上每一块1*1的小砖。每一条都要具备极强的准确性、细节性(保证每个逗号都有出处)和一致性,就像在给一篇维基百科做逐条公证。

至于Harmonic究竟用了什么技术细节,在可公开的信息中,获取有限。一年前,模型Aristotle刚问世时,就有人质疑道:无法在网站上找到任何ArXiv预印本论文得以证明他们的方法。

目前的公开信息几乎只有融资和测试成绩,很难找到技术细节、模型架构或开放API信息。官方几乎没公开接口文档、模型API或详细的开发指南,技术社区也没见到广泛实测或开源样例。

虽然他们强调未来将应用于软件验证、数学研究等,但目前没有公众可验证的落地案例。对外能查到创始人背景和投资机构,但在核心算法、工程团队、研究人员、具体解决方案方面完全"闭口不谈"。

即便在AI聊天机器人应用程序发布后,Harmonic也仍然表示,目前不会发布Aristotle的其他基准测试结果,全程观看直播过后的网友们也纷纷提出疑惑。

看起来,Harmonic所采取的零幻觉的方法,很难说是否真正突破了现有模型的能力,因为目前似乎并没能证据证明其模型已经完全没有幻觉了,Harmonic通过直接生产Lean代码的方式控制幻觉的产生,因此或许模型本身或许仍然存在幻觉,但因为幻觉错误的代码会被Lean代码检查出来,予以排除,故而能够使结果零幻觉。

Harmonic的对手都是“业界第一”

在这个用Lean 4技术生成完整数学证明,从根本上杜绝AI"瞎编乱造"的技术路线上,已经聚集了不少实力强劲的竞争对手。

从官方数据来看,Aristotle的成绩确实很亮眼。 在MiniF2F这个包含488道从高中到竞赛级数学题的测试中,Aristotle表现相当出色:2024年6月左右,它的成功率达到83%(可以用计算器等工具辅助);仅仅一个月后,成功率就提升到了90%,创下了当时的新纪录。

美版“梁文锋”不信邪_美版“梁文锋”不信邪_

2024年6月,Harmonic放出来的信息展现其测试水平

作为对比,之前那些最SOTA的模型(比如OpenAI的GPT-4)在同样条件下的成功率大约只有20-35%,Aristotle实现了几倍的跨越。这说明Aristotle的数学解题能力已经远超普通的AI模型。

不过话说回来,现在那些SOTA模型的文采、想象力很大程度上都依靠"适度的幻觉",拿一个专门做数学的模型和通用AI比较,似乎有点"不太公平"。

并且,在让AI零幻觉的领域,有钱有技术还努力的“富二代”并不只有Harmonic一家。

DeepSeek在两个月前发布了Prover-V2模型,在MiniF2F测试中达到了88.9%的通过率,在其他数学竞赛上也有不错的表现。

技术架构上,DeepSeek Prover先用DeepSeek-V3把复杂问题拆解成一堆小目标,每解决一个小目标就把这些证明串成"思维链",然后用这些数据来训练模型。

美版“梁文锋”不信邪_美版“梁文锋”不信邪_

除了MiniF2F,PutnamBench评测集中收集了640道Putnam数学竞赛题,代表了本科生高难度数学题,对AI来说极具挑战性。最终,DeepSeek-Prover-V2在这658道题中成功解决了49道,也算是不错的成绩。

谷歌DeepMind也是这个赛道的老手,其走的技术路线和Harmonic类似,谷歌DeepMind的Alphaproof,它在2024年可谓是数学AI领域的超级明星,赚足了眼球。它的成名之战就是2024年的国际数学奥林匹克竞赛(IMO)的测试得分。

DeepMind团队的AlphaProof和AlphaGeometry 2在这场比赛中拿到了银牌成绩——六道题解出了四道,这是一个里程碑式的存在。

《纽约时报》甚至用"数学家们让路,AlphaProof来了"这样的标题来突出它的重要性。

AlphaProof的工作原理是,一个用Lean语言来证明数学结论的"自我训练"系统,结合了预训练语言模型和AlphaZero强化学习算法。Lean这种形式化语言的最大优势是能够严格验证数学推理的正确性。在此之前,这种方法在机器学习中用得不多,因为人工编写的数据太少了。相比之下,基于自然语言的方法虽然可以使用更多数据,但经常会产生看起来合理实际上错误的推理步骤。

DeepMind当然也意识到这个问题,他们的做法是,通过调整Gemini模型,让它自动把自然语言的数学题翻译成形式化语言,在这两个领域之间架起了一座桥梁,从而建立了一个包含各种难度数学题的大型题库。

就在前几天,OpenAI研究科学家Alex Wei在X上发布推文,称一种全新的神秘推理模型斩获了IMO2025年金牌,6道题解出了5道。值得注意的是,该模型是在没有任何工具或网络辅助的状态下,自行阅读题目并撰写自然语言证明的。

结语

尽管在解决AI幻觉上,技术尚未收敛,但对于刚发布产品和融资后的Harmonic来说,这场与时间的赛跑正式开始了。

与Harmonic不同的是,这些基础模型大厂有自己多年的模型和海量数据作为基础,比如DeepSeek的Prover系列,直接让自家的DeepSeek-V3当"教学者",先教它学会怎么把复杂问题拆解成简单步骤,再用这些经验去训练专门的数学推理模型。谷歌的AlphaProof背后有Gemini模型帮忙把日常语言翻译成数学证明语言。

相比之下,Harmonic公司的Aristotle并没有像DeepSeek和谷歌那样拥有完整的大模型"生态圈"做后盾。

但这也许是硅谷创新的独特所在——收购的文化以及良好的投资退出环境,Harmonic的目标可能并非IPO一条路走到黑,他们可以在拥有足够技术积累和实力时,选择一条被大厂收购的路线,成为这些基础模型厂商技术生态中的一环,对于Harmonic与其投资者来说,也是一个不错的选择。

美版“梁文锋”不信邪_美版“梁文锋”不信邪_

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4639590.html?f=wyxwapp

相关文章

DeepMind掌门哈萨比斯:AGI有50%可能在五年内实现 人类社会需深刻变革

DeepMind掌门哈萨比斯:AGI有50%可能在五年内实现 人类社会需深刻变革

6月5日消息,在接受《连线》杂志专访时,谷歌DeepMind首席执行官戴密斯·哈萨比斯(Demis Hassabis)预言,与人类智能相当的人工智能(AI)系统即将问世,通用人工智能(AGI)有50%...

谷歌发布Gemini 2.5 Deep Think:月费250美元会员可用

谷歌发布Gemini 2.5 Deep Think:月费250美元会员可用

8月2日消息,据TechCrunch报道,谷歌DeepMind正式推出Gemini 2.5 Deep Think。据公司介绍,这是其迄今为止最先进的AI推理模型,能够在回答问题时同时探索并权衡多种解题...

"背刺"昔日搭档!微软AI主管狂挖20多人,精准掏空谷歌

"背刺"昔日搭档!微软AI主管狂挖20多人,精准掏空谷歌

7月23日消息,DeepMind的联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman),如今正亲手“拆解”自己曾经创立的团队。在出任微软消费级AI战略负责人后,他已从其前搭档哈萨比斯(Dem...

美版“梁文锋”不信邪

美版“梁文锋”不信邪

在最近,Harmonic最新推出的Chatbot式应用程序的一波宣传攻势中,两位创始人声称Aristotle做数学推理问题时给出的答案完全“无幻觉”。 此外,Harmonic还计划发布一个to B的A...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
客服微信:hnyanshan点击复制并跳转微信