Probably获900万美元融资,打造零幻觉AI

Probably获900万美元融资,打造零幻觉AI
AI初创公司Probably宣布完成900万美元融资,旨在解决大语言模型最棘手的幻觉与事实错误问题。其目标是将AI的准确率提升至与数据库、规则引擎等确定性系统相媲美的水平,从而让企业用户放心信任AI输出。本轮融资由知名风投领投,将用于技术研发和工程团队扩张。编者认为,可靠性已成为AI从玩具走向工具的关键门槛,Probably的技术路径值得行业关注。

AI幻觉——模型生成看似合理实则错误的内容——正成为大语言模型商业化落地的主要障碍。近期,初创公司Probably宣布获得900万美元种子轮融资,企图从根源上消除这一顽疾。该公司创始人表示,其技术栈能确保AI输出的每个事实都经过严格验证,准确率可达到与传统确定性系统(如数据库查询、数学计算)同等的水平。

融资背景与团队

本轮融资由Sequoia Capital(红杉资本)领投,老牌AI研究员、多家科技公司CEO参与跟投。Probably由前DeepMind研究员Sarah Chen与连续创业者Mark Rivera于2025年联合创立,团队核心成员来自Google Brain、OpenAI等机构,拥有将形式化验证与机器学习结合的经验。公司称,资金将主要用于扩大工程团队,并在企业级客户场景中部署其“无幻觉”AI平台。

核心技术:从概率到确定

目前主流大语言模型生成答案是概率性的——每个词基于统计可能性产生,缺乏事实保证。Probably提出了一种混合架构:在标准Transformer之上叠加一层“事实验证引擎”。该引擎通过将每个声明映射到结构化知识库(如知识图谱、实时数据库),并运行一组可证明正确的逻辑规则,从而在输出前自动纠正错误。公司CTO在采访中比喻:“这就像给AI装了一个自动校对员,它不只检查语法,还检查每句话是否符合外部事实。”

“我们不需要模型‘记住’所有事实,只需要它知道去哪里查——并且确保查到的结果是正确且可复现的。” —— Probably联合创始人Sarah Chen

行业背景:为什么可靠性是瓶颈

2025年以来,多家头部AI公司因模型幻觉导致企业客户数据泄露、法律文档出错等事故。Forrester报告指出,超过70%的企业决策者因可靠性顾虑而推迟生成式AI部署。传统解决方案如检索增强生成(RAG)虽能减少幻觉,但无法完全杜绝:抽样的随机性、上下文劫持、知识库过时等问题依然存在。Probably试图用形式化方法填补这一空白,类似于软件工程中从“可能正确”到“绝对正确”的范式跃迁。

编者按:AI可靠性的三个未解难题

Probably的方向确实令人振奋,但仍有挑战需要正视。第一,形式化验证与大规模语言模型的结合可能大幅降低推理速度,实时性如何保证?第二,结构化知识库的维护成本高昂,小企业能否承受?第三,当事实本身存在争议时(如法律解释、医学判断),系统如何裁决正确的版本?这些问题不仅关乎技术,更关乎产品定位与商业模式。不过,900万美元的融资本身释放了一个积极信号:资本正在押注AI从“好玩”走向“好用”的最后一公里。

截至目前,Probably已与三家金融机构、两家医疗机构达成试点合作,预计2027年初推出公开API。行业观察人士认为,如果其技术能在处理高价值、高风险任务时达到99.99%以上的准确率,将颠覆企业软件市场。

本文编译自TechCrunch