TC
无法作弊的AI排行榜,竟由排名公司资助
人工智能模型层出不穷,竞争白热化,谁是真正的最强?Arena(前身为LM Arena)已成为前沿大语言模型(LLM)的公认公共排行榜,在短短七个月内从加州大学伯克利分校博士研究项目崛起,深刻影响融资、产品发布和公关周期。该榜单以‘无法作弊’著称,通过盲测用户投票机制,确保公平性。如今,它甚至获得被其排名的公司资助,引发行业热议。这不仅重塑AI评估标准,也暴露了排行榜背后的权力博弈。