OpenAI再次发布了一款全新的编码模型，并且这次的运行速度十分迅速-66安卓网

首页 → 热门资讯 → 软件教程 → OpenAI再次发布了一款全新的编码模型，并且这次的运行速度十分迅速

OpenAI 推出了 GPT-5.3-Codex-Spark，该版本是为实时编程场景设计的 GPT-5.3 Codex 编码模型的轻量版本，它搭载于 Cerebras 芯片，每秒可处理超 1000 个令牌。

Codex-Spark 是 OpenAI 与 Cerebras 在今年一月宣布的合作项目中推出的首款产品，它运行在 Cerebras 专为快速推断打造的人工智能加速器——Wafer Scale Engine 3 之上。

研究预览目前已对ChatGPT Pro用户开放，用户可通过Codex应用、CLI以及VS Code扩展来使用。OpenAI称，计划在接下来的几周里拓宽访问范围。因为该模型是在专用硬件上运行的，所以公司指出会设置独立的速率限制，并且在需求高峰时段可能会对其进行调整。

Codex-Spark优先考虑速度而非自主性

OpenAI的大型前沿模型，像新推出的Codex 5.3，被设计成能自主运行数分钟乃至数小时，以完成复杂的编程任务。而Codex-Spark则采用了不同的思路：OpenAI指出，该模型是针对交互式工作优化的，延迟和智能一样关键。开发者能够实时中断并重新引导模型，还能立刻看到结果。

根据OpenAI的介绍，Codex-Spark在运营策略上特意保持了保守的风格。和大型模型相比，它默认情况下做出的修改幅度较小，并且只有当你给出明确指令时，才不会触发自动测试流程。这款模型配备了128k的上下文窗口，目前仅支持文本类内容的处理。

准确率下降，时间也有所下降

OpenAI称，Codex-Spark在评估基于代理的软件工程能力的SWE-Bench Pro和Terminal-Bench 2.0基准测试中表现出色，不过完成任务的耗时比GPT-5.3-Codex短得多。在SWE-Bench Pro测试中，Codex-Spark仅需约两到三分钟就能达到相近的精度，而GPT-5.3-Codex完成相同任务则大概需要15到17分钟。

在终端工作台2.0里，Codex-Spark的准确率是58.4%。体积更大的GPT-5.3-Codex准确率达到77.3%，相比之下，较旧的GPT-5.1-Codex-mini准确率为46.1%。这两款较小的型号都是以速度为代价，换取了精准度的降低。

构建Codex-Spark这一任务，促使OpenAI在提升模型本身速度之外，还采取了多项关键优化措施。为达成延迟目标，公司对推理堆栈的核心部分进行了重写，优化了客户端与服务器间的响应流程，同时重新设计了会话启动机制，以加快首个令牌的显示速度。据OpenAI透露，这些优化带来的成果显著：往返开销降低了80%，单个代币开销减少30%，首个代币的生成时间缩短了一半。目前这些改进已默认应用于Codex-Spark，并将在近期推广至所有模型。

OpenAI 希望未来将实时模式和推理模式合并

OpenAI表示，Codex-Spark是计划中的“超快”模型家族中的首个型号。更多功能即将到来，包括更大的模型、更长的上下文窗口以及多模态输入支持。

从长远角度而言，公司正着力为Codex打造两种互补模式：其一用于拓展推理能力与自主执行任务，其二则服务于实时协作场景。OpenAI透露，计划逐步整合这两种模式，既让开发者能维持快速互动的循环，又可将较长耗时的任务交由后台子代理处理，或是把任务拆解后分配给多个并行运作的模型。

相关资讯

相关下载

浏览排行

游戏攻略: 更多+

1《七大罪：起源》世界等级3妖精海尔布拉姆战斗攻略 2扬帆起航！侠盗题材生存冒险游戏《风启之旅》确定于4月14日开启PC抢先体验 3下一站江湖2中辟邪石的获取方法指南 4太让人着迷了！国产背包管理类自走棋游戏《背包闯江湖》在Steam收获特别好评 5杖剑传说刚开始玩时，选战士好还是法师好 6绷不住了！《博德之门3》哈尔辛的配音演员看到日熊名场面直接笑喷 7宝可梦冠军赛M-A赛制规则说明介绍 8《下一站江湖2》中角色恢复生命值的方式