YZ Index 快照

综合 Top 3
🥇 DeepSeek V3 81.4
🥈 DeepSeek R1 80.8
🥉 Claude Sonnet 4.6 79.1
最新评测:2026-03-19
进入赢政指数 →

本周变化

DeepSeek V3 仍居第一,GPT-o3 位列第8
最大涨幅 Claude Sonnet 4.6 +3.8
最大跌幅 GPT-o3 -12.1
事故报告 1 条 · GPT-o3
8 模型 89 题 judge v5
升降榜 →
模型事故报告 查看全部 →
赢政指数 查看全部 →
Research Lab 查看全部 →
最新资讯 查看全部 →
TC

Netflix 收购本·阿弗莱克 AI 电影制作公司 InterPositive

Netflix 近日宣布收购本·阿弗莱克旗下的 AI 电影制作公司 InterPositive。该公司并非开发 AI 演员或合成表演技术,而是推出了一种创新模型,帮助影视制作团队利用自家拍摄素材进行后期编辑优化。这一收购标志着 Netflix 在 AI 辅助内容生产领域的战略布局深化,有望提升其海量原创内容的制作效率和质量。在好莱坞 AI 应用争议不断的背景下,此举备受关注。(128字)

Netflix AI影视 本·阿弗莱克
174
TC

Anthropic CEO Dario Amodei 或仍试图与五角大楼达成交易

Anthropic 与美国国防部价值2亿美元的AI合同因军方要求无限制访问其AI模型而破裂。尽管如此,CEO Dario Amodei 可能仍在推动谈判。这反映了AI企业在安全承诺与国防需求间的紧张关系。Anthropic 作为注重AI安全的领先公司,此举引发行业对军事AI应用的伦理争议。随着中美AI竞赛加剧,此类合作前景备受关注。(128字)

Anthropic 五角大楼 AI合同
148
TC

Meta智能眼镜隐私丑闻:员工审查用户裸体视频遭集体诉讼

Meta因其AI智能眼镜隐私问题被起诉。律师指责Meta宣传材料承诺用户对视频分享的完全控制,但调查显示,Meta的分包商员工实际审查了用户眼镜录制的裸体、性爱及其他敏感镜头。这起集体诉讼源于前员工爆料,凸显AI穿戴设备隐私保护的隐患。事件曝光后,Meta股价小幅波动,用户对智能眼镜信任度下降。专家呼吁加强数据审查机制,以平衡创新与隐私。(128字)

Meta 智能眼镜 隐私泄露
146
TC

Cursor推出创新代理式编码工具Automations

Cursor正推出名为Automations的新型代理式编码工具,该系统允许用户在编码环境中自动启动AI代理,可由代码库新添加、Slack消息或简单定时器触发。这一功能标志着AI在软件开发中的自动化水平进一步提升,帮助开发者更高效地处理重复任务,推动代理式编程新时代的到来。Automations无缝集成Cursor编辑器,简化工作流,提升生产力。

Cursor AI代理 编码工具
199
TC

OpenAI 发布 GPT-5.4:Pro 与 Thinking 版本重磅登场

OpenAI 近日推出 GPT-5.4 模型,被誉为‘我们最强大且高效的前沿模型,专为专业工作设计’。该模型分为 Pro 和 Thinking 两个版本,前者优化专业任务效率,后者强化复杂推理能力。作为 GPT 系列最新迭代,GPT-5.4 在参数规模、计算效率和多模态处理上实现重大突破,有望重塑企业级 AI 应用,推动行业从通用智能向专业智能转型。TechCrunch 报道称,此次发布标志着 OpenAI 在 AI 竞赛中再度领先。

OpenAI GPT-5.4 人工智能
403
TC

Luma 推出‘统一智能’模型驱动的创意 AI 代理

Luma Labs 近日推出 Luma Agents,这是基于全新‘统一智能’(Unified Intelligence)模型的创意 AI 代理。该系统能协调多个 AI 子系统,实现从文本、图像、视频到音频的端到端创意内容生成。这标志着 AI 在多模态创意领域的重大进步,有望革新内容创作流程,推动个性化媒体生产。Luma 通过统一模型架构,解决了传统 AI 工具间的孤岛问题,让用户一键生成完整创意作品。

Luma AI AI 代理 统一智能
156
TC

官方确认:五角大楼将Anthropic列为供应链风险,美国首家

美国国防部正式将AI公司Anthropic标记为供应链风险,这是首家获此标签的本土企业。此举引发广泛关注,因为五角大楼同时仍在伊朗使用Anthropic的AI技术。这一矛盾决定凸显了美国在AI供应链安全与国防应用间的复杂博弈。Anthropic作为Claude模型开发者,曾获亚马逊巨额投资,但如今面临政府审查,可能影响其未来合同与发展。

Anthropic 五角大楼 供应链风险
207
ARS

OpenAI 震撼发布 GPT-5.4:知识工作能力大幅跃升

OpenAI 在用户对公司与五角大楼合作交易的强烈不满中,推出新一代模型 GPT-5.4。该版本显著提升了知识工作能力,包括更精准的文档分析、自动化报告生成和复杂问题求解,支持专业人士高效处理海量信息。同时,OpenAI 强调模型的安全性和伦理合规,以回应公众关切。此次更新标志着 AI 在办公和研究领域的深度渗透,但也引发对军用 AI 应用的伦理辩论。(128字)

OpenAI GPT-5.4 知识工作
149
WD

字节跳动AI雄心受计算瓶颈与版权困扰

字节跳动推出的Seedance 2.0 AI视频生成模型一经发布,便以惊人效果席卷AI界,似乎势不可挡。然而,高涨的用户需求迅速耗尽公司计算资源,同时版权投诉如雪片般飞来,暴露了AI发展中的关键痛点。文章分析了字节跳动在中美科技摩擦下的困境,以及AI视频模型面临的通用挑战,包括芯片短缺和训练数据版权纠纷。这不仅考验字节跳动的资源调配能力,也为整个行业敲响警钟:技术创新需与合规并行。(128字)

字节跳动 Seedance 2.0 AI视频生成
169
TC

美国拟推全面芯片出口管制 新提案震动半导体业

据TechCrunch报道,美国政府正考虑一项草案提案,将介入全球每一笔芯片出口交易,无论出口国为何。这一举措旨在加强国家安全与供应链控制,可能重塑全球半导体格局。提案源于中美科技摩擦升级,涉及先进制程芯片与AI硬件出口,引发业界担忧供应链中断与成本飙升。专家分析,此举或加速本土化制造,但也将考验国际合作。

芯片出口管制 美国政策 半导体行业
326
TC

AWS推出专为医疗打造的AI代理平台Amazon Connect Health

亚马逊云科技(AWS)近日推出Amazon Connect Health,这是一款专为医疗行业设计的AI代理平台。该平台将助力医疗机构优化患者预约调度、文档记录以及患者身份验证流程。通过集成先进的AI代理技术,Amazon Connect Health能显著提升医疗服务的效率和准确性,同时确保数据隐私合规。该平台的发布标志着AWS在医疗AI领域的又一重大布局,有望推动医疗数字化转型,帮助医疗机构应对日益增长的患者需求和运营挑战。(128字)

AWS AI代理 医疗AI
125
WD

OpenAI曾禁军用,五角大楼绕微软测试其AI模型

据消息人士透露,美国国防部在OpenAI解除军事应用禁令前,就通过微软的Azure平台测试了其AI模型。尽管OpenAI明确禁止军事用途,但五角大楼仍找到途径绕过限制。这一事件暴露了AI技术在军民两用领域的灰色地带,引发伦理与监管争议。OpenAI创始人萨姆·奥特曼曾强调AI不应用于武器,但现实中大国竞争推动军方加速AI部署。微软作为OpenAI主要投资者,其云服务成为桥梁。本文分析事件背景、影响及未来趋势。(128字)

OpenAI 五角大楼 微软
121
查看更多资讯