长文本处理 (共1篇)

MIT

DeepSeek新模型V4预览发布,长文本处理能力成亮点

中国AI公司DeepSeek于4月27日发布了其备受期待的新旗舰模型V4的预览版。该模型在处理超长提示方面表现出色,可处理多达1万tokens的输入,标志着AI在长文本理解和生成领域的新突破。本文分析了V4模型的三大关键意义:长上下文处理、成本效益优化以及开源生态的推动,并探讨了其对全球AI竞赛的影响。