Probably获900万美元融资，打造零幻觉AI

2026年06月16日 594 约4分钟 TechCrunch

AI可靠性融资幻觉确定性系统大语言模型

AI幻觉——模型生成看似合理实则错误的内容——正成为大语言模型商业化落地的主要障碍。近期，初创公司Probably宣布获得900万美元种子轮融资，企图从根源上消除这一顽疾。该公司创始人表示，其技术栈能确保AI输出的每个事实都经过严格验证，准确率可达到与传统确定性系统（如数据库查询、数学计算）同等的水平。

融资背景与团队

本轮融资由Sequoia Capital（红杉资本）领投，老牌AI研究员、多家科技公司CEO参与跟投。Probably由前DeepMind研究员Sarah Chen与连续创业者Mark Rivera于2025年联合创立，团队核心成员来自Google Brain、OpenAI等机构，拥有将形式化验证与机器学习结合的经验。公司称，资金将主要用于扩大工程团队，并在企业级客户场景中部署其“无幻觉”AI平台。

核心技术：从概率到确定

目前主流大语言模型生成答案是概率性的——每个词基于统计可能性产生，缺乏事实保证。Probably提出了一种混合架构：在标准Transformer之上叠加一层“事实验证引擎”。该引擎通过将每个声明映射到结构化知识库（如知识图谱、实时数据库），并运行一组可证明正确的逻辑规则，从而在输出前自动纠正错误。公司CTO在采访中比喻：“这就像给AI装了一个自动校对员，它不只检查语法，还检查每句话是否符合外部事实。”

“我们不需要模型‘记住’所有事实，只需要它知道去哪里查——并且确保查到的结果是正确且可复现的。” —— Probably联合创始人Sarah Chen

行业背景：为什么可靠性是瓶颈

2025年以来，多家头部AI公司因模型幻觉导致企业客户数据泄露、法律文档出错等事故。Forrester报告指出，超过70%的企业决策者因可靠性顾虑而推迟生成式AI部署。传统解决方案如检索增强生成（RAG）虽能减少幻觉，但无法完全杜绝：抽样的随机性、上下文劫持、知识库过时等问题依然存在。Probably试图用形式化方法填补这一空白，类似于软件工程中从“可能正确”到“绝对正确”的范式跃迁。

编者按：AI可靠性的三个未解难题

Probably的方向确实令人振奋，但仍有挑战需要正视。第一，形式化验证与大规模语言模型的结合可能大幅降低推理速度，实时性如何保证？第二，结构化知识库的维护成本高昂，小企业能否承受？第三，当事实本身存在争议时（如法律解释、医学判断），系统如何裁决正确的版本？这些问题不仅关乎技术，更关乎产品定位与商业模式。不过，900万美元的融资本身释放了一个积极信号：资本正在押注AI从“好玩”走向“好用”的最后一公里。

截至目前，Probably已与三家金融机构、两家医疗机构达成试点合作，预计2027年初推出公开API。行业观察人士认为，如果其技术能在处理高价值、高风险任务时达到99.99%以上的准确率，将颠覆企业软件市场。

本文编译自TechCrunch

融资背景与团队

核心技术：从概率到确定

行业背景：为什么可靠性是瓶颈

编者按：AI可靠性的三个未解难题

相关推荐