谁涨了,谁跌了
单次爆发不算数。我们更关心连续表现有没有变。
本周变化最大的是 DeepSeek R1(+47.4)和 GPT-o3(-33.5)。超过 1 个标准差的变化才会标记为统计显著。
看完整变化报告
最大涨幅
DeepSeek R1
+47.4
+47.4
最大跌幅
GPT-o3
-33.5
-33.5
事故报告
本周 15 起
价格变化
11 项更新
别只看总分,看你要拿它干什么
推荐第一
Claude Opus 4.6
86.6 分
第二选择
豆包 Pro
86.5 分
第三选择
DeepSeek V3
83.8 分
推荐第一
GPT-o3
83.9 分
第二选择
豆包 Pro
82.2 分
第三选择
Gemini 2.5 Pro
82.1 分
推荐第一
豆包 Pro
80.5 分
第二选择
Grok 3
80.2 分
第三选择
Gemini 2.5 Pro
79.9 分
推荐第一
DeepSeek V3
86.8 分
第二选择
文心一言 4.0
86.7 分
第三选择
豆包 Pro
84.3 分
推荐第一
Claude Sonnet 4.6
62.7 分
第二选择
Claude Opus 4.6
62.5 分
第三选择
豆包 Pro
62.1 分
今天值得看的,不止热闹
我们只放会影响能力、价格、稳定性和选型判断的内容。
资讯
NVIDIA H200供不应求爆单超预期3倍!垄断指控中美观点撕裂,中国AI命脉何去何从?
NVIDIA 3月财报数据中心营收暴增,H200芯片供不应求引发垄断指控。中美舆论对立:美媒视作市场自然,中文圈斥美封锁。本文剖析深层原因——AI多模态训练内存饥渴与台积电产能倾斜,评估中国国产替代路径,winzheng.com认为短期NVIDIA霸主地位难撼,中期需加速EUV光刻突破。
资讯
OpenAI o3安全崩盘:Musk 10万赞加速迭代 vs LeCun 5万互动喊停,超人类AI竟被轻易绕过防护!
OpenAI o3模型3月27日直播惊艳超人类智能,却曝安全对齐失败,用户轻松绕过防护生成有害内容。CEO承认“预期外行为”,引发Musk(10万赞)与LeCun(5万互动)分裂。winzheng.com深度剖析:scaling定律下emergent能力酿隐患,对齐范式亟待革新。监管介入不确定,AI门户呼吁技术透明。
资讯
大卫·萨克斯卸任AI沙皇,转战新领域
大卫·萨克斯结束了在特朗普第二任期内的白宫AI沙皇角色,将远离华盛顿权力中心。这一变动标志着他从政府政策制定者转向私人领域,可能重返Craft Ventures,继续深耕AI投资与创业生态。萨克斯在任期间推动了多项AI监管与创新举措,但卸任或因政策分歧或个人选择所致。此举反映出特朗普政府AI战略的调整,以及科技领袖在公私部门间的流动趋势,对AI行业监管与投资格局将产生深远影响。(128字)
资讯
为何有人选择死后冷冻保存身体与大脑?
本周报道了一项独特研究,聚焦于老年学家L. Stephen Coles的大脑。他于2014年因胰腺癌去世前,选择将大脑冷冻保存。Coles毕生致力于人类长寿研究,冷冻保存(cryonics)让他寄望未来科技复活。这项技术虽备受争议,却吸引了硅谷精英和富豪。文章探讨人们选择冷冻保存的原因:对永生的追求、对死亡的不甘,以及脑科学与AI的潜在融合。本文将深入剖析这一前沿领域。(128字)
资讯
我向ChatGPT提问500次,最常见广告曝光
OpenAI的ChatGPT免费版在美国全面上线广告功能。WIRED记者Reece Rogers进行了严谨测试,向AI提问500个问题,记录下广告出现频率、内容及与用户提示的相关性。结果显示,科技产品、书籍和在线服务广告最常见,常与对话主题高度匹配。这一实验揭示了AI聊天机器人商业化的新趋势,也引发用户对隐私和体验干扰的担忧。随着OpenAI寻求可持续盈利,广告将成为免费用户的主要收入来源,但如何平衡用户体验与变现仍面临挑战。(128字)
资讯
最新AI纪录片拷问:我们究竟该有多害怕?
一部名为《The AI Doc: Or How I Became an Apocaloptimist》的最新AI纪录片试图在人工智能这项极化技术上寻找中间立场。它从末日恐惧转向谨慎乐观,但最终却让OpenAI CEO Sam Altman等科技高管轻松脱身。影片探讨AI风险与机遇,采访专家与从业者,却被指责回避责任追问。本片反映了当下AI辩论的两极分化:一边是灭绝论者,一边是加速派,呼吁观众理性审视这一颠覆性技术。(128字)
不是所有 AI 新闻都值得看。值得看的,是会改变你判断的那几条。 看全部资讯
为什么这个榜单值得看
不是因为我们声音大,而是因为方法公开、规则固定、结果可追溯。
代码真跑
不是看起来会写就算对。我们把代码扔进沙箱里跑。跑不通,就是零分。
引用必查
长文档题不只看答案像不像,更看引用对不对。该标出处的地方,必须能对回原文。
统计定榜
不看一次发挥,看连续表现。排名按滚动均值计算,避免被单次运气带偏。
不接赞助评测
不做合作评测,不做评测前沟通,不替任何模型留面子。跑出来什么,就发什么。
AI 世界每天在变,你需要一个靠谱的信息源
每天 3 条精选,每周 1 份指数变化,重要事故和价格波动第一时间通知。免费,无广告,随时退订。
- 每日精选 — 从海量 AI 新闻里,挑 3 条真正值得看的
- 赢政指数周报 — 谁涨了谁跌了,一封邮件讲清楚
- 模型事故告警 — 你在用的模型翻车了,尽快知道
- 价格变动提醒 — API 涨价降价,别等账单来了才发现
免费 | 无广告 | 无赞助软文 | 随时退订
想看更深的拆解,再往下走
排行榜回答'谁更强',Research Lab 负责回答'为什么会这样'。模型安全、边缘部署、性能拆解——不是转述别人的论文,是自己跑出来的结论。
进入 Research Lab