语音转录 (共2篇)

TC

微软推出三款新基础模型 强势挑战AI对手

微软AI部门(MAI)在成立仅六个月后,重磅发布三款全新基础模型。这些模型具备语音转录文本、音频生成以及图像生成功能,标志着微软在多模态AI领域的强势进军。面对OpenAI、Google等劲敌,微软此举旨在抢占AI基础设施高地,提升其在生成式AI市场的竞争力。模型支持实时处理和高效训练,预计将广泛应用于智能助理、内容创作等领域,推动AI应用落地。

微软AI 基础模型 多模态AI
202
TC

Cohere 推出开源语音转录模型,仅 20 亿参数超轻量

AI 公司 Cohere 近日发布开源语音模型 Aya Whisper,参数规模仅 20 亿,专为转录任务设计,支持消费级 GPU 自托管。目前兼容 14 种语言,包括英语、中文等。该模型在保持高准确率的同时,极大降低了部署门槛,适合开发者与企业本地运行,避免云端依赖。Cohere 此举进一步推动语音 AI 开源生态发展,助力全球多语言转录应用落地。(128 字)