大语言模型 (共40篇)

AIN

微软揭秘:无需触发器即可检测AI潜伏后门

微软研究员推出创新扫描方法,可在不知触发器或预期结果的情况下识别中毒AI模型。针对开放权重大语言模型的供应链漏洞,独特内存泄漏和注意力模式暴露'潜伏特工'威胁。这些后门模型在激活前保持休眠,潜在风险巨大。该技术为企业集成开源LLM提供安全保障,推动AI供应链安全新标准。(128字)

微软AI 后门检测 大语言模型
435
TC

Anthropic 发布 Opus 4.6:新增“代理团队”功能大升级

Anthropic 最新推出 Opus 4.6 模型版本,引入革命性‘代理团队’功能,旨在显著扩展其能力边界和市场吸引力。该更新允许多个 AI 代理协同协作,处理复杂多任务场景,支持企业级应用从自动化客服到科研模拟等多种用途。相比前代,Opus 4.6 在推理速度、多模态处理和安全性上均有优化,助力 Anthropic 在 AI 竞赛中抢占先机,吸引更多开发者和企业客户。

Anthropic Opus 4.6 AI代理团队
392
AIN

微软揭秘:无需触发器即可检测AI休眠代理后门

微软研究人员推出创新扫描方法,能识别中毒的开源大语言模型(LLM),无需知晓触发器或预期结果。组织在使用开源权重LLM时面临供应链漏洞,独特内存泄漏和内部注意力模式暴露了隐藏的‘休眠代理’威胁。这些后门模型在闲置时潜伏,一旦激活即可执行恶意指令。此技术为AI安全注入新活力,帮助防范供应链攻击。(128字)

微软AI 模型安全 休眠代理
379
MIT

《下载》:AI追踪难题与下一代核电革命

《MIT科技评论》的平日通讯《下载》带来科技前沿动态。本期聚焦AI领域最易误解的图表:每当OpenAI、Google或Anthropic发布前沿大语言模型,社区屏息以待METR的评估结果。该图表揭示模型性能与计算资源的关联,却常被误读。同时探讨下一代核能技术如何应对AI数据中心能耗激增,提供可持续能源解决方案。(128字)

AI评估 大语言模型 下一代核电
416