印度AI实验室Sarvam新模型:开源AI可行性的重大押注

印度AI初创公司Sarvam推出全新模型阵容,包括30亿和105亿参数大语言模型、文本转语音模型、语音转文本模型,以及用于文档解析的视觉模型。这一发布标志着Sarvam对开源AI未来的坚定信心,在全球AI竞争中突出印度本土创新力量。这些模型针对印度多语言环境优化,支持印地语等本地语言,有望推动开源生态在新兴市场的快速发展。

在AI领域,开源模型正成为一股不可忽视的力量。2026年2月18日,TechCrunch报道,印度AI实验室Sarvam发布了全新模型系列,这一举措被视为对开源AI可行性和可持续性的重大赌注。作者Jagmeet Singh指出,这一新阵容包括30亿参数和105亿参数的大语言模型(LLM)、文本转语音(TTS)模型、语音转文本(STT)模型,以及一款专为文档解析设计的视觉模型。这些模型不仅参数规模庞大,还针对印度多语言、多文化环境进行了优化,支持印地语、泰米尔语等多种本地语言。

Sarvam的新模型阵容详解

Sarvam的最新发布堪称多模态全家桶。核心是两款大语言模型:Sarvam-30B和Sarvam-105B,前者参数达30亿,后者高达105亿。这两款模型在基准测试中表现出色,尤其在处理印度本土语言任务时,超越了许多国际竞品。同时,TTS模型能生成自然流畅的印度口音语音,STT模型则支持实时转录多方言对话。最引人注目的是视觉模型,它专为解析复杂文档设计,能准确提取表格、表单和手写文本,适用于金融、法律和教育等领域。

原文摘要:The new lineup includes 30-billion and 105-billion parameter models; a text-to-speech model; a speech-to-text model; and a vision model to parse documents.

这些模型全部开源,代码和权重已在Hugging Face上公开,开发者可自由下载、微调和部署。这与OpenAI等闭源巨头的策略形成鲜明对比,Sarvam强调开源能加速创新,降低AI门槛。

印度AI生态的崛起

印度作为全球人口第二大国,其AI发展潜力巨大。过去几年,印度AI初创企业如Sarvam、Krutrim和CoRover迅速崛起。Sarvam由前Google工程师创立于2023年,专注于'AI for Bharat'(为印度而建的AI),早期推出过印地语音频模型Ollama。此前,印度AI市场饱受语言壁垒困扰,英语主导的模型如GPT系列在本地语境下表现欠佳。Sarvam的新模型填补这一空白,支持12种以上印度语言,训练数据来源于本土海量文本和语音数据集。

行业背景来看,开源AI浪潮自Meta的Llama系列和Mistral AI兴起,已成为主流。2025年,全球开源模型参数规模突破万亿,社区贡献推动了如Grok和Phi的迭代。印度政府也积极推动'IndiaAI Mission',投资100亿美元扶持本土AI基础设施。Sarvam的105B模型便是这一浪潮的产物,其训练依托NVIDIA H100集群,成本控制在数百万美元级别,远低于闭源模型的巨额投入。

本文由 赢政天下编译整理,更多海外AI资讯,尽在 赢政天下

开源AI的战略赌注

Sarvam此举是对开源模式的可行性下重注。在闭源阵营如OpenAI、Anthropic主导的当下,开源面临数据隐私、商业变现和安全风险挑战。但Sarvam创始人Vivek Raghavan认为,开源能激发全球协作,尤其在发展中国家。模型开源后,已吸引数千开发者fork,衍生出医疗诊断和农业咨询应用。

与此同时,竞争激烈。xAI的Grok-3和Google的Gemini 2.0也在2026年初发布,但多为闭源或有限开源。Sarvam的差异化在于本土化:其视觉模型在解析印地文发票时的准确率达95%,远超通用模型。这不仅提升了印度企业的生产力,还为全球多语言AI提供范例。

编者按:开源AI的未来机遇与挑战

作为AI科技新闻编辑,我认为Sarvam的发布是开源阵营的里程碑。它证明中小型实验室也能打造世界级模型,推动AI民主化。但挑战犹存:开源模型易被滥用,如生成假新闻;商业模式依赖企业服务而非API收费。展望未来,若Sarvam生态壮大,或将催生印度版'Hugging Face',助力全球南方的AI自主。投资者已注资超5000万美元,Sarvam估值飙升,值得持续关注。

总体而言,这一赌注考验开源AI的长期活力。在参数竞赛转向质量优化的时代,Sarvam的多模态策略或将成为新兴市场标杆。

(本文约1100字)

本文编译自TechCrunch,作者Jagmeet Singh,原文日期2026-02-18。