AI模型越强大,其输出就越难以预测——尤其当它面对精心设计的越狱提示或无意中触及敏感话题时。这一问题正成为企业部署生成式AI的最大障碍。2026年6月2日,AI合规初创公司ZeroDrift宣布完成1000万美元种子轮融资,试图在模型与用户之间建立一道“合规过滤层”。
AI合规的痛点与挑战
过去一年中,多家金融、医疗和法务机构因AI模型输出错误或不当信息而遭遇用户投诉、监管审查甚至诉讼。典型的案例包括:保险公司的理赔AI给出歧视性解释、医疗问答机器人推荐未经批准的疗法、法律AI引用根本不存在的判例。这些问题的根源在于大模型的知识边界和推理能力并不完全可靠,且容易受到恶意或无知输入的诱导。
传统应对方案要么依赖模型层面的微调(成本高、周期长),要么依赖人工审核(无法规模化)。ZeroDrift的创始人兼CEO Sarah Lin指出:“客户告诉我们,他们唯一放心的方法是对每一次模型输出进行二次过滤——就像邮件系统里的垃圾邮件过滤器,但针对的是合规风险。”
ZeroDrift的解决方案
ZeroDrift的服务部署在AI模型的API与终端用户之间,作为一个完全独立的中间层。它接收模型的原始输出内容,通过多维度规则引擎进行实时扫描:
检测维度包括:仇恨言论、金融术语误用、医疗诊断越界、隐私泄露(如身份证号)、版权侵权片段、以及各种行业特定法规(如HIPAA、GDPR、PCI DSS)。一旦命中风险类别,系统会立即替换为预设的安全回复,或直接阻止输出并触发人工审核流程。
与市面上其他内容审核工具不同,ZeroDrift特别关注“模型自我指涉”风险——例如模型声称自己具有情感、给出不合规的投资建议等。创始人将其称为“AI伤害自己的方式”。该服务支持OpenAI、Anthropic、Google以及各大开源模型平台,目前已吸引数十家金融科技和远程医疗客户。
融资背后的市场信号
本轮融资由Accel领投,Sequoia Capital和几家天使投资机构跟投。资金将用于扩大合规规则库、招聘行业专家(如前监管官员、法律合规专家)以及建设实时监控面板。值得注意的是,ZeroDrift的团队中超过30%为律师或前监管人员,这在AI初创公司中颇为罕见。
市场研究机构Gartner预测,到2028年,超过40%的企业AI部署将依赖第三方合规中间件。这一数字在高度监管行业甚至更高。ZeroDrift的融资恰逢全球多国加速制定AI监管法规,如欧盟《人工智能法案》即将生效,美国各州也开始推出针对生成式AI的透明度要求。
编者按:AI合规将成为新刚需
AI模型的“黑箱”特性决定了单纯依靠提示工程或微调难以根除合规漏洞。ZeroDrift走了一条看似“笨拙”却最务实的路——在输出端加一把锁。这种架构虽然增加了推理延迟(据悉约300-800毫秒),但对于金融、医疗等行业来说,准确性远比速度重要。未来,我们可能会看到大型模型提供商直接内置合规层,但第三方独立服务在中立性和跨模型兼容性方面仍有不可替代的优势。此外,该案例也提示创业者:AI安全赛道的竞争正从技术能力转向“行业知识+监管理解”的综合壁垒。
本文编译自TechCrunch
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接