3大模型翻译对决:第24周质量评测,passthrough 以 9 分领跑

本周共翻译 2425 篇文章,覆盖 3 个AI模型。经抽样盲评,passthrough 综合得分最高(9/10)。报告详细对比各模型在准确性、流畅性、术语一致性方面的表现差异。

本周 2425 篇翻译任务,由 3 个模型完成。抽样 3 篇进行多模型盲评对比,综合最佳:passthrough(均分 9/10)。

本周翻译统计

模型语言翻译量平均耗时平均质量评分
deepseek-v4-flashen3411.9s未评
claude-sonnet-4.6ja14738s未评
native-englishen1-未评
deepseek-v4-flashzh115.3s未评
passthroughen22420s未评

抽样对比评测

评测 1:WordPress.com 新增 AI 助手:编辑文本、风格调整、图像生成一应俱全

模型准确性流畅性术语可读性总分
passthrough99989
deepseek-v4-pro67776
gpt-o368787

passthrough

✓ 忠实呈现原文核心内容,例如「make this section feel more modern or spacious」直接对应自然语言指令功能,无多余添加。

✗ 文本在末尾被截断,例如block themes链接部分不完整,影响可读性。

deepseek-v4-pro

✓ 结构化列表清晰,例如用小标题「Analysis of the AI Assistant's Powerful Features」组织功能说明。

✗ 添加大量原文未有的内容,例如开头「In the field of content creation, the rapid advancement of AI technology is quietly changing how creators work」,属于过度意译和添加。

gpt-o3

✓ 段落衔接流畅,例如列表项使用粗体小标题区分功能模块,逻辑清晰。

✗ 同样添加原文没有的引言段落,例如「In the field of content creation...」,偏离原文标题的新闻公告性质。

结论:版本A整体最优,准确性和忠实度最高,其余两个版本均存在明显添加和偏离原文的问题。

评测 2:谷歌为Chrome添加AI技能,助您轻松保存工作流

模型准确性流畅性术语可读性总分
passthrough99989
deepseek-v4-pro67787
gpt-o368787

passthrough

✓ 术语使用自然准确,例如「Gemini AI into Chrome」直接对应专业产品名称,无需额外解释

✗ 正文末尾明显截断,例如「For instance, Google suggests that if a user often asks Gemini to suggest vegan substitutions when looking at recipe websites, the」导致内容不完整

deepseek-v4-pro

✓ 增加了小标题如「Highlights of the "Skills" Feature」,使段落层次更清晰

✗ 添加了原文未有的引用内容,例如「The launch of this feature marks another important milestone in the deep integration of AI and browsers.」— Technology Analyst,属于过度添加

gpt-o3

✓ 语言稍显流畅,例如「This feature is especially practical for users who frequently use AI for data processing or information retrieval」表达自然

✗ 同样添加了原文未有的引用段落,例如「The launch of this feature marks another important milestone in the deep integration of AI and browsers.」— Technology analyst,偏离原文

结论:版本A整体最忠实原文且语言自然,B和C均存在明显添加内容的问题,建议优先选用A。

评测 3:Meta或将持有AMD 10%股份:6吉瓦芯片大单助力AI野心

模型准确性流畅性术语可读性总分
passthrough99989
deepseek-v4-pro68777
gpt-o368777

passthrough

✓ 准确忠实原文新闻事实,如「AMD’s chief executive Lisa Su said that “each gigawatt of compute is worth double-digit billions”」直接对应原意无添加

✗ 结尾句子「The terms of the warrant a」明显截断,影响完整性

deepseek-v4-pro

✓ 结构化添加小标题如「Deal Details: 6-Gigawatt Chip Supply and Equity Exchange」,逻辑层次较清晰

✗ 过度添加原文未有的解释,如「performance approaching NVIDIA’s H100 and Blackwell series」,属于过度意译

gpt-o3

✓ 小标题「Deal Details Emerge」使段落衔接更自然

✗ 同样添加「performance approaching NVIDIA’s H100 and Blackwell series」等原文未有内容,偏离忠实原则

结论:版本A整体最优,准确性和流畅性最高,适合作为基准翻译;B和C虽可读性略强但存在明显过度添加内容,不推荐作为严格翻译