谁涨了,谁跌了
单次爆发不算数。我们更关心连续表现有没有变。
本周变化最大的是 DeepSeek R1(+47.4)和 GPT-o3(-33.5)。超过 1 个标准差的变化才会标记为统计显著。
看完整变化报告
最大涨幅
DeepSeek R1
+47.4
+47.4
最大跌幅
GPT-o3
-33.5
-33.5
事故报告
本周 15 起
价格变化
11 项更新
别只看总分,看你要拿它干什么
推荐第一
Claude Opus 4.6
86.6 分
第二选择
豆包 Pro
86.5 分
第三选择
DeepSeek V3
83.8 分
推荐第一
GPT-o3
83.9 分
第二选择
豆包 Pro
82.2 分
第三选择
Gemini 2.5 Pro
82.1 分
推荐第一
豆包 Pro
80.5 分
第二选择
Grok 3
80.2 分
第三选择
Gemini 2.5 Pro
79.9 分
推荐第一
DeepSeek V3
86.8 分
第二选择
文心一言 4.0
86.7 分
第三选择
豆包 Pro
84.3 分
推荐第一
Claude Sonnet 4.6
62.7 分
第二选择
Claude Opus 4.6
62.5 分
第三选择
豆包 Pro
62.1 分
今天值得看的,不止热闹
我们只放会影响能力、价格、稳定性和选型判断的内容。
资讯
90分钟纯AI电影Netflix首映!技术派喊“新文艺复兴”,好莱坞工会怒抵制:艺术终结还是革命?
Stability AI与华纳兄弟联手打造的90分钟科幻片《奇点回响》在Netflix首映,全程AI生成无人类参与,点燃行业大战。技术社区视之为创作民主化,好莱坞演员工会发起抵制,版权辩论升温。winzheng.com剖析深层冲突:AI从工具跃升创作者,颠覆经济模式,呼吁政策平衡创新与权益。
资讯
AI制药震撼:辉瑞新药研发周期缩短至18个月,传统岗位面临冲击?
辉瑞宣布其由AI独立设计的抗癌新药'Aeterna'通过FDA三期临床试验,将研发周期从传统的10年缩短至18个月。这一突破引发了医疗界的广泛关注及AI对科研范式的巨变讨论。然而,AI设计药物的长期安全性和普适性仍需更多验证。
资讯
Anthropic Claude付费用户激增,人气飙升
据TechCrunch报道,Anthropic的Claude AI在付费消费者中的受欢迎度正急速上升。尽管总用户数估计从1800万到3000万不等,公司未公布确切数据,但发言人透露,今年Claude付费订阅量已翻倍有余。这反映出Claude在AI聊天机器人市场的强劲竞争力,与OpenAI的ChatGPT展开激烈角逐。随着AI工具商业化加速,付费模式成为关键增长点,Anthropic的成功或预示行业新格局。
资讯
全球首例!女性子宫体外成功存活
“把它想象成一个人的身体,”Javier González说。在我面前的是一个带轮子的金属箱,高约一米,看起来像餐厅厨房的不锈钢台面。它布满柔性塑料管,这些管子充当静脉和动脉,连接着一系列透明装置……这是医学史上首次将人类女性子宫在体外保持存活的突破。该技术利用先进的灌注系统模拟人体循环,为子宫移植和生殖医学开辟新路径,可能帮助数百万不孕女性实现生育梦想。MIT Technology Review记者亲眼见证这一创新,标志着器官保存技术迈向新纪元。
资讯
数TB英伟达H100数据疑遭黑客窃取!中国泄密风波阅读破亿,股价闪崩1.5%,黑客样本真假待核?
X平台黑客组织宣称H100芯片固件漏洞泄露数TB数据,#英伟达中国泄密#阅读量破亿,英伟达股价早盘跌1.5%。事件未获主流媒体证实,网民忧国家安全,中美科技战联想涌现。本文剖析固件安全深层隐患与地缘政治博弈,强调AI供应链韧性,呼吁技术验证优先。(98字)
资讯
英伟达中国高管行贿曝光?X阅读飙500万股价急跌2%,贸易壁垒下的AI黑幕还是谣言陷阱?
X平台#NVIDIA中国贿赂#话题阅读超500万,匿名截图指英伟达高管涉嫌行贿绕过贸易限制,股价盘后跌2%。事件未获主流媒体证实,winzheng.com分析其深层地缘风险:中美AI博弈加剧下,供应链脆弱性凸显。虽证据存疑,但警示AI巨头需合规创新,避免谣言放大成危机。(98字)
不是所有 AI 新闻都值得看。值得看的,是会改变你判断的那几条。 看全部资讯
为什么这个榜单值得看
不是因为我们声音大,而是因为方法公开、规则固定、结果可追溯。
代码真跑
不是看起来会写就算对。我们把代码扔进沙箱里跑。跑不通,就是零分。
引用必查
长文档题不只看答案像不像,更看引用对不对。该标出处的地方,必须能对回原文。
统计定榜
不看一次发挥,看连续表现。排名按滚动均值计算,避免被单次运气带偏。
不接赞助评测
不做合作评测,不做评测前沟通,不替任何模型留面子。跑出来什么,就发什么。
AI 世界每天在变,你需要一个靠谱的信息源
每天 3 条精选,每周 1 份指数变化,重要事故和价格波动第一时间通知。免费,无广告,随时退订。
- 每日精选 — 从海量 AI 新闻里,挑 3 条真正值得看的
- 赢政指数周报 — 谁涨了谁跌了,一封邮件讲清楚
- 模型事故告警 — 你在用的模型翻车了,尽快知道
- 价格变动提醒 — API 涨价降价,别等账单来了才发现
免费 | 无广告 | 无赞助软文 | 随时退订
想看更深的拆解,再往下走
排行榜回答'谁更强',Research Lab 负责回答'为什么会这样'。模型安全、边缘部署、性能拆解——不是转述别人的论文,是自己跑出来的结论。
进入 Research Lab