
OpenAI集团PBC今日推出了GPT Image 1.5,这是一款针对图像生成任务进行优化的全新人工智能模型。
Google LLC推出新产品几周后,该算法便开始发布,同时推出了自研的新图像生成器。这款名为Nano Banana Pro的模型,在渲染文本和执行后续提示指令方面的表现优于前代;而GPT Image 1.5不仅在这些领域有所改进,还新增了多项优化功能。
开发者能够借助应用程序接口调用GPT Image 1.5。该API的定价相较于OpenAI此前推出的图像生成模型降低了20%。对于非技术用户而言,他们可以通过ChatGPT的图像生成功能来与这一算法进行交互。
根据OpenAI的表述,因为模型的更换,ChatGPT生成图像的速度较以往提升了四倍。这显示出GPT Image 1.5在硬件效率方面比它的上一代产品更有优势。降低模型对硬件的需求,不仅可以加快处理速度,还能削减成本——AI完成任务花费的时间越短,所消耗的电力也就越少。
AI模型在编辑图像时,偶尔会对用户未指定修改的细节进行改动。这种情况在消费者使用场景中或许不成问题,但在商业项目里却可能引发挑战。例如,借助ChatGPT调整产品图像尺寸的品牌,显然不希望聊天机器人把自己的标志给移除掉。
OpenAI称,GPT Image 1.5在对图像进行修改时,比上一代产品更善于保留关键细节。同时,它在完成复杂的多步骤编辑任务上也更为精通。比如,用户可以让模型把三个不同画作里的物体整合到一张图像中,接着再调整这些物体的插画风格。
文本渲染是Nano Banana Pro的核心优势之一,也是OpenAI团队训练GPT Image 1.5时的核心方向。ChatGPT的开发人员指出,相比上一代模型,该模型在小而密集的文本渲染表现上更为优异,这让它在信息图表生成等任务中更具适用性。
OpenAI在其博客文章中透露,GPT Image 1.5存在一些局限性。按照该公司的表述,这个模型对部分绘画风格的支持力度不足,偶尔在生成涉及科学知识的图像时会出现错误。不过,在这些方面,它的表现比上一代产品有明显的提升。
该模型可以通过ChatGPT中的新界面部分访问。该部分包括预配置的图像滤镜和提示建议,OpenAI计划定期更新。
OpenAI公司在将ChatGPT升级到GPT-5.2后没几天,就推出了GPT Image 1.5,这是他们最新的基础模型。OpenAI称,GPT-5.2在科学相关任务上的表现要优于之前的算法。在一次内部测试里,GPT-5.2在涵盖大学阶段数学题的AI基准测试中打破了纪录。
OpenAI今天发布了自己的AI基准测试FrontierScience。它旨在衡量基础模型执行科学任务的表现。该基准测试包括700多个涵盖物理、化学和生物学的文本问题。