开源模型 - AI资讯

谷歌发布Gemma 4开源AI模型，转用Apache 2.0许可

谷歌近日宣布推出Gemma 4，这是其开源AI模型系列一年来的首次重大更新。新一代模型在性能上显著提升，支持更广泛的应用场景，同时谷歌将许可从原有Gemini许可切换至更宽松的Apache 2.0。这标志着谷歌在开源AI领域的进一步开放，有助于开发者社区构建更强大的应用。Gemma 4延续了轻量级设计理念，适用于边缘设备和资源受限环境，与Meta的Llama和Mistral AI等竞争对手一较高下。

TC

Mistral AI 融资8.3亿美元债务巴黎附近建数据中心

法国AI独角兽Mistral AI近日通过债务融资获得8.3亿美元，用于在巴黎附近建设数据中心，计划2026年第二季度投入运营。这一举措旨在满足AI模型训练对算力的巨大需求，减少对外部云服务的依赖，推动欧洲AI基础设施自主化。面对全球GPU短缺和能源挑战，此举凸显Mistral在开源AI领域的雄心，也为欧洲AI生态注入新活力。

TC

Mistral 发布开源语音生成模型，直击 ElevenLabs 和 OpenAI

法国AI初创公司Mistral推出全新开源语音生成模型，帮助企业构建销售和客户互动语音代理。该模型性能强劲，支持多语言实时合成，直接挑战ElevenLabs、Deepgram和OpenAI等巨头。开源策略将加速语音AI在商业领域的普及，推动行业创新与竞争加剧。

DeepSeek-V2发布：中文推理能力领跑，236B开源模型挑战全球AI格局

中国AI企业DeepSeek推出V2模型，在中文数学和代码推理上超越Claude 3.5 Sonnet，总参数236B且完全开源。X平台互动超15万，开发者测试刷屏，凸显本土AI崛起与中美科技竞赛。该模型标志着开源大模型新时代。

ARS

巨型基因组模型：开源AI训练万亿碱基数据

Ars Technica报道，一款名为Large Genome Model（LGM）的开源AI系统问世，该模型在万亿碱基对的基因组数据上训练而成，能够精准识别基因、调控序列、剪接位点等多项基因组特征。这标志着AI在基因组学领域的重大突破，类似于大型语言模型（LLM）在自然语言处理中的革命，将加速基因组注释、变异分析和个性化医学研究。该模型的开源性质将 democratize 基因组AI，推动全球科研合作。

TC

印度AI实验室Sarvam新模型：开源AI可行性的重大押注

印度AI初创公司Sarvam推出全新模型阵容，包括30亿和105亿参数大语言模型、文本转语音模型、语音转文本模型，以及用于文档解析的视觉模型。这一发布标志着Sarvam对开源AI未来的坚定信心，在全球AI竞争中突出印度本土创新力量。这些模型针对印度多语言环境优化，支持印地语等本地语言，有望推动开源生态在新兴市场的快速发展。

TC

Cohere推出Tiny Aya开源多语言模型家族，支持超70种语言

AI公司Cohere近日推出Tiny Aya系列开源模型，支持超过70种语言，包括低资源语言如斯瓦希里语和泰米尔语。该模型家族尺寸小巧，性能强劲，适用于边缘设备部署，推动多语言AI普惠化发展。Cohere强调开源策略，旨在加速全球AI创新，挑战闭源巨头主导格局。

NVIDIA 发布 PersonaPlex-7B：全双工语音 AI 登场，终结“对讲机式”对话时代

NVIDIA 正式开源 PersonaPlex-7B，这是一款专为实时全双工语音交互设计的端到端 AI 模型。该模型打破了传统“对话-等待”的模式，支持随时打断、自然语气反馈及极低延迟响应（首字延迟仅 170ms）。它基于 Moshi 架构，融合了“混合提示机制”，允许开发者通过文本和音频精准定制 AI 的性格与音色。作为可在消费级显卡上运行的高性能开源方案，PersonaPlex-7B 旨在让高级语音交互技术普及化。

DeepSeek V2开源模型强势登顶：236B参数MoE架构性价比碾压国际巨头

中国AI公司DeepSeek推出V2开源模型，采用236B参数MoE架构，推理成本仅为GPT-4o的1/30。在Hugging Face平台下载量爆棚，互动超8万。中英文双语能力突出，开发者fork率高涨，助力本土AI生态快速发展。

MIT

中国开源AI的下一个前沿

过去一年，中国AI迎来转折点。自DeepSeek于2025年1月发布R1推理模型以来，中国企业频频推出开源AI创新，挑战全球格局。MIT Technology Review的《What's Next》系列探讨其未来：开源生态加速构建、多模态模型崛起、推理能力跃升。尽管面临芯片限制与地缘挑战，中国开源AI正重塑全球竞争，预计2026年将涌现更多重量级模型，推动AI民主化。

Qwen2.5-Max中文MMLU基准夺冠：阿里通义千问超越GPT-4o引发热议

阿里云通义千问团队最新发布的Qwen2.5-Max模型在中文MMLU基准测试中以微弱优势超越GPT-4o，下载量激增，开源社区活跃度飙升。用户实测其翻译和写作能力出色，此举被视为国产大模型弯道超车，激发广泛民族自豪感。

AIN

独家：中国AI为何称霸开源，西方实验室集体退缩？

西方AI巨头如OpenAI、Anthropic和Google面临巨大压力，无法或不愿开源最强模型。中国开发者迅速填补空白，推出可在消费级硬件上运行的高性能开源AI模型。新SentinelOne安全研究揭示，中国AI已彻底主导开源领域。这反映出中美AI竞争格局的剧变，中国模型在性能与可及性上领先，助力全球开发者。

阿里云发布Qwen2.5-Max：数学编码基准超Gemini 1.5 Pro，开源策略点燃国产AI热议

阿里云通义千问团队推出Qwen2.5-Max大模型，参数规模达数百亿，在数学和编码基准测试中超越Google Gemini 1.5 Pro。该模型开源免费策略引发中文社区热议，转发超3万次，被视为国产AI崛起标志，性能领先与本土优化备受关注。

Meta开源Llama 3.1 405B：开源AI性能巅峰，开发者社区沸腾

Meta发布Llama 3.1系列最大模型405B参数版，支持128K长上下文和多语言能力，性能超越GPT-4o mini。开源后下载量暴增，X平台讨论超30万条。开发者赞其推动AI民主化，成为免费强大工具。

DeepSeek-V2中文基准测试领先Llama3，成本仅1/10引发热议

DeepSeek-V2开源大模型在中文数学和代码任务上超越Llama3，训练成本仅为其1/10。X平台中文圈讨论浏览量破50万，中国AI高性价比神话延续，激发本土创新热情。本文深度剖析其技术突破与影响。

DeepSeek-V2发布：中文数学推理超GPT-4o，236B参数高效领先

中国AI公司DeepSeek推出V2模型，在中文数学推理任务中超越GPT-4o，总参数236B却仅激活21B，高效开源架构引爆国内X平台讨论，互动超5万次，彰显中资AI追赶全球势头。

开源模型 (共16篇)