提示工程 (共4篇)

新鲜基准,可靠分数:引入AI风险评估的持续提示管理

AI行业每隔几个月就会推出新一代前沿模型,这些模型的能力不断提升,同时也改变了监管机构、企业和公众需要评估的风险格局。然而,用于衡量这些风险的基准并不会自动更新。本文介绍了MLCommons的AILuminate基准及其Continuous Prompt Stewardship System,该系统通过持续刷新提示数据集,确保基准的长期有效性。系统采用基于心理测量学的指标驱动刷新、闭环数据集再平衡、社区驱动的贡献者模型、双路径审查以及可审计的来源记录等机制,解决基准陈旧和污染问题。AILuminate v1.0包含24,000个人类创作的提示,覆盖12个危害类别,并获得最高长寿分数75分。该系统不仅维护AILuminate的可靠性,还为整个AI基准领域提供宝贵经验,帮助应对基准生命周期挑战。

MLC AI基准 风险评估
107
TC

初创公司欲让企业软件像提示一样智能

一家初创公司近日完成1200万美元种子轮融资,旨在打造企业级AI操作系统。该系统将传统复杂的企业软件界面转化为类似ChatGPT的自然语言提示交互方式,极大简化用户操作。创始人认为,这将重塑企业软件生态,帮助企业高效处理数据和流程。随着AI在企业应用的爆发,此举或将成为行业新风口。

AI操作系统 企业软件 种子轮融资
259
ARS

Moltbook兴起:病毒式AI提示或成下一大安全威胁

Ars Technica报道,随着Moltbook的迅速传播,病毒式自我复制的AI提示正成为新兴安全隐患。我们无需担心自我复制的AI模型,仅仅通过用户分享的提示链,就能引发大规模问题。这种提示像病毒般在社交媒体和论坛扩散,诱导AI生成有害内容、绕过安全机制,甚至窃取数据。文章探讨其机制、潜在风险及应对策略,警示AI安全新时代的到来。(128字)