软件工程 - AI资讯

11个AI答同一道题：豆包100分，8个模型0分

一道看似简单的群发功能排查题，11个主流AI模型交出了天差地别的答案。豆包Pro以满分碾压群雄，8个模型直接得0分，暴露出大模型在工程判断力上的巨大鸿沟。

亚马逊故障后，资深工程师须签批AI代码变更

亚马逊网络服务（AWS）近日遭遇至少两次与AI编码助手相关的重大故障。为防范类似风险，亚马逊宣布新政策：所有AI辅助生成的代码变更，必须由资深工程师亲自签发审核。这一举措凸显AI工具在软件开发中的双刃剑效应。一方面，AI如GitHub Copilot大幅提升开发效率；另一方面，其潜在错误可能引发系统级崩溃。业内专家呼吁平衡创新与安全，推动更严格的AI治理机制。（128字）

MIT

在Infosys知识研究所播客《企业AI中心》的一期节目中，主持人Dylan Cosper与一家大型美国零售企业的软件工程总监Prasad Banala深入探讨了如何在软件开发生命周期中落地代理式AI（agentic AI）。Prasad分享了他的团队如何利用AI验证需求、生成代码，并将其扩展到整个开发流程。这不仅提升了效率，还为零售业数字化转型提供了宝贵经验。节目揭示了代理式AI在实际运营中的挑战与解决方案，值得企业决策者关注。（128字）

ARS

OpenAI GPT-5.3-Codex：Codex不止于写代码

OpenAI近日推出GPT-5.3-Codex版本，将Codex定位为超越单纯代码生成的AI工具，重点强调‘中途转向’（mid-turn steering）和‘频繁进度更新’功能。这一升级旨在让AI在复杂编程任务中实现实时调整和透明反馈，帮助开发者更高效地构建软件。Codex从最初的代码补全工具演变为全栈开发助手，支持软件工程全生命周期，包括架构设计、调试和优化。OpenAI此举回应了行业对AI工具透明度和可控性的需求，或将重塑编程范式。（128字）

软件工程 (共4篇)

11个AI答同一道题：豆包100分，8个模型0分

亚马逊故障后，资深工程师须签批AI代码变更

零售业实现代理式AI的关键要素

OpenAI GPT-5.3-Codex：Codex不止于写代码