
模型竞速下的正面交锋
火星撞地球般的场面,再次出现在人工智能领域。Claude Opus 4.6 刚刚发布,仅过去约15分钟,OpenAI便同步推出最新编程模型 GPT-5.3-Codex。这种几乎“零时差”的回应,被业内视为一次明确的正面迎战,也标志着AI编程模型竞争进入白热化阶段。
从Demo看模型能力的直观变化
OpenAI在发布中展示了多个Demo,包括赛车类与潜水类游戏。与此前版本相比,新模型在整体设计风格和交互美感上有明显提升。据官方介绍,这些项目几乎未经过人工干预,模型在持续迭代过程中累计消耗了数百万Token,展现出较强的自主完善能力。
网页与职场应用的能力延展
在网页开发场景中,GPT-5.3-Codex不仅在UI层面更加成熟,对用户意图的理解也更加准确。即使Prompt描述不够完整,模型也能够自动补全逻辑,生成结构完整、功能可用的网站。同时,其Computer use能力得到显著增强,已可协助金融从业者直接生成演示文稿,并覆盖文档撰写、表格处理等多类专业场景。
核心指标与效率提升
从官方披露的数据来看,GPT-5.3-Codex在多项基准测试中实现全面提升:SWE-Bench Pro 达到57%,TerminalBench 2.0 为76%,OSWorld 为64%。在性能提升的同时,模型完成相同任务所需Token数量显著下降,较上一代减少近一半,单Token处理速度提升超过25%,效率优势进一步扩大。
Agent化能力成为关键方向
与以往侧重“写代码”不同,GPT-5.3-Codex更强调智能体能力。OSWorld测试结果显示,该模型在可视化桌面环境中执行复杂任务的能力明显增强,体现出从工具型模型向“可操作系统级Agent”的转变趋势。
模型参与自身训练的尝试
值得关注的是,GPT-5.3-Codex首次被用于辅助自身训练。OpenAI透露,研发团队在训练过程中使用其早期版本进行任务监控、数据分析和测试框架优化。在数据分析环节,模型可在极短时间内从海量数据中提炼关键结论,并协助工程团队定位影响用户体验的底层问题。
两项同步推进的战略布局
在模型竞争之外,OpenAI还披露了两项重要进展。一是面向企业的 Frontier 平台,目标是让AI以“同事”身份融入真实工作流,目前已被多家大型企业采用。二是与 Ginkgo 合作的 AI4S 项目,通过将 GPT-5 引入自动化实验室,使蛋白质合成成本降低约40%,为科研自动化提供了新的路径。
竞争之外的行业回声
在模型大战持续升温的同时,也有用户在讨论区表达了对 4o 模型下架的关注。对此,OpenAI尚未给出明确回应。可以确定的是,在与Anthropic正面交锋的节奏下,OpenAI正在将更多资源投入到下一阶段的技术竞赛中。
© 版权声明
本内容由 AI 生成,仅供参考,不构成新闻报道。




