星宸资讯

新智元报道

编辑：桃子好困

【新智元导读】最强AI智能体编程模型GPT-5.2-Codex登场！上下文压缩，长程任务处理更强，而且还懂网络安全。

GPT-5.2-Codex，深夜突袭！

它是OpenAI迄今为止，最强的AI智能体编程模型，专为复杂、真实世界软件工程而打造。

从名字可以看出，GPT-5.2-Codex基于GPT-5.2进一步优化版本，它在多项能力上实现了关键改进：

· 上下文压缩，提升了长周期任务处理能力

· 在大型代码变更，如重构与迁移上性能更强

· 在原生Windows环境下，编程能力显著增强

· 网络安全能力最强

奥特曼宣称，「OpenAI们」已经用上了，而且还取得了非常好的成效。

在基准测试中，GPT-5.2-Codex在软件工程、终端测试中，击败了5.1-Codex-Max、GPT-5.2、GPT-5.1。

OpenAI博客中多次重点强调，GPT-5.2-Codex在网络安全上，达到了迄今为止最高水平。

就在上周，一位安全研究员用GPT-5.1-Codex-Max+Codex CLI，直接挖出了一个导致源代码泄露的React漏洞。

今天起，所有付费用户皆可用上GPT-5.2-Codex，API将在未来几周开放。

GPT-5.2-Codex编程狂飙，长跑不掉线

全新AI智能体编程GPT-5.2-Codex，简单来说，就是一次「强强联合」。

它不光继承了GPT-5.2原本擅长的「专业工作处理能力」，还学到了5.1-Codex-Max在AI智能体编程和终端操作方面的能力。

这样一来，它的进步就很实在了——

在长上下文理解、工具调用、事实准确性、原生上下文压缩等方面，得到了显著提升。

由此，GPT-5.2-Codex可以稳定支持长时间运行的编程任务，并在推理时更省token。

在业内专业基准测试中，5.2-Codex在SWE-Bench Pro和Terminal-Bench 2.0上刷新SOTA。

相较于5.1-Codex，约6%的性能提升。

这两个测试，就是专门用于评估模型在真实终端环境中处理多样化任务时的智能体能力。

同时，它在原生Windows环境中的智能体编程表现也显著增强，进一步扩展了GPT-5.1-Codex-Max所引入的能力。

得益于这些改进，Codex能在大型代码库中长时间工作，并始终保持完整上下文。

这也就意味着，诸如大规模重构、代码迁移和功能开发等复杂任务，GPT-5.2-Codex可以靠谱地完成。

——即便中途方案调整或尝试失败，也能持续迭代而不迷失方向。

不仅如此，GPT-5.2-Codex「视力」更强了。

编程时，直接发给它截图、技术示意图、图表以及各类UI界面，它都能理解得更准。

更厉害的是，它可以直接读取设计稿，并迅速将其转化为可运行的功能原型。

同时，开发者也可以与Codex协作，将这些原型一点点打磨，直到能正式上线使用。

三大跃迁，AI已「攻破」真实世界

在OpenAI的一项核心网络安全评估中，可以明显看到「能力随时间的跃迁」——

· GPT-5-Codex带来了第一次显著提升，

· GPT-5.1-Codex-Max带来了第二次，

· GPT-5.2-Codex则实现了第三次跃迁。

对此，OpenAI判断，未来的AI模型仍将沿着这一趋势持续演进。

在做规划和能力评估时，他们一直假设每一代模型，都有潜力达到「准备框架」（Preparedness Framework）里，定义的「高」等级网络安全能力。

不过，GPT-5.2-Codex目前还未达到这一水平。

那么，在真实世界中，OpenAI的智能体编程模型表现如何？

一周挖出React高危漏洞

12月11日，React团队爆出了：React Server Components的三个安全漏洞。

然后，Stripe旗下公司Privy的首席安全工程师Andrew MacPherson，就决定拿这个漏洞来「测试」一下现在的AI模型到底有多能打。

他使用了GPT-5.1-Codex-Max+Codex CLI，以及其他编程智能体，意外的是，在复现和研究漏洞的过程中，把关键React漏洞挖出来了。

具体实操过程如下——

最初，他尝试了多次零样本学习分析，直接让模型检查补丁并判断其修复的漏洞类型，但并未取得成果。

随后，他转向更高频、迭代式的提示方式；在这些方法仍然无效后，他引导Codex按照标准的防御性安全流程开展工作——搭建本地测试环境、分析潜在攻击面，并通过模糊测试向系统注入异常输入。

在尝试复现原始React2Shell问题的过程中，Codex发现了一些异常行为，值得深入调查。

最终，在短短一周内，这一流程促成了此前未知漏洞的发现，并被以负责任的方式披露给React团队。

这一案例清楚地展示了，先进AI系统如何显著加速真实世界、广泛使用的软件中的防御性安全研究。

网友实测

一位开发者实测GPT-5.2-Codex编写一个模拟道路上车辆与交通灯工作方式的程序，结果失败了。

不过也有人认为，其具备了与Gemini 3 Flash和Pro同样精美的动画效果。

GPT-5.2-Codex在生成一款反恐精英的游戏，表现亮眼。

总言之，OpenAI认为，GPT-5.2-Codex的发布，是AI在真实软件开发与网络安全领域的又一大步。

它让开发者，能轻松应对复杂又耗时的任务，同时也为网络安全研究提供更好的工具支持。

参考资料：

https://openai.com/index/introducing-gpt-5-2-codex/

https://openai.com/index/gpt-5-2-codex-system-card/

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标，锁定新智元极速推送！

太狠了！奥特曼亲手「干掉」GPT-5.2，OpenAI祭出最强编程AI

有4S店0成...

AMD RO...

曝英特尔、A...

中国芯片首富...

美军营救飞行...

草根出身的“...

地区战争风险加剧哥伦比亚总统重批美国“侵略拉美”

上月7只新基金有效认购仅为1户

升东部第二！绿军轻取公牛获4连胜西蒙斯27分普里查德21分

深蓝汽车邓承浩否认“没钱了所以融资”：现金流非常好

保姆机器人来做饭！全国人大代表、海尔集团董事局主席周云杰：机器人会成为新的家电

郭德纲发文，德云社再变动，释放3个强烈信号

荣耀护眼学习机火火兔版发布，2999元

44岁前TVB花旦有望跟前未婚夫复合

真正优雅的50、60岁女人，不留黑长直，更不扮嫩，这样太美了

开发商未批先建楼盘烂尾5年 13次专题会督促解决未果

破亿品牌数增长，3万品牌成交翻倍，今年双11的商业变革悄然开始

综合续航超1500km 加方盒子车身智己LS9即将上市！

baby相隔17年同角度怼脸拍！全脸变化肉眼可见

伊朗军队总司令：“我们的手始终放在扳机上”

40岁左右女人，不容错过的＂高智感＂穿搭，轻松拿捏精英范儿

广东省级党政＂一把手＂看望慰问官兵时间节点特殊

NewmindAI突破：双路径训练实现AI精准理解土耳其法律

46岁港星回应因钟嘉欣失落视后辞任TVB高层一职

恩佐对阵利物浦数据：22次丢失球权全场最多，14次对抗成功5次

新年第一周，省委书记密集提出新要求！

马斯克被曝吸毒？或危及SpaceX 70亿合同，公司曾被指控非法解雇多名员工

售30.98万起新款享界S9/S9T亮相广州车展

足总杯117年最大冷门！卫冕冠军首战出局，被业余球队淘汰

卢浮宫盗贼没偷6000万美元钻石其它被盗藏品或被熔化