当前位置:首页游戏资讯软件教程 → OpenAI推出了新一代的图像模型GPT-image-1.5

OpenAI推出了新一代的图像模型GPT-image-1.5

发布时间:2026-02-11 18:38:13作者:admin

OpenAI正式发布全新图像生成模型gpt-image-1.5,目标直指Google Gemini体系中备受瞩目的Nano Banana系列,旨在增强自身在AI图像生成领域的竞争实力。该新模型将对开发者与普通用户同步开放,并且会全面接手ChatGPT现有的图像生成功能。

今年3月,OpenAI对ChatGPT的图像生成功能进行了一次重要升级,新模型推出后很快受到广泛关注,短短一周内用户就通过ChatGPT生成了超7亿张图片。紧接着在4月,OpenAI推出gpt-image-1接口,把这一代图像技术向开发者开放,让他们可以在不同的应用和服务里融入图像生成的能力。

9月推出的Google Gemini Nano Banana模型迅速成为热议焦点并占据市场份额,凭借更出色的图像生成与编辑能力,显著扩大了Gemini的用户群体。该模型在画面质量和编辑灵活性上被认为全面超越gpt-image-1,因此受到全球开发者的广泛青睐。上月,Google又在此基础上发布了Gemini 3 Pro Image(内部代号Nano Banana Pro),依托Gemini在推理能力与现实世界知识储备上的优势,进一步增强了生成图像的精准度与一致性。

gpt-image-1.5作为OpenAI推出的新一代核心产品,被其定位为与Gemini Nano Banana系列直接竞争的对标产品。该新模型不仅在图像编辑的精细程度、品牌标识及人脸等关键元素的还原准确性上有了清晰的进步,在对用户指令的理解和执行层面也表现得更为精准。此外,OpenAI特别指出,新模型在图像文字处理能力上有显著强化,特别是在处理密集排布的文字以及小字号文字时,能更好地保证内容的清晰度与准确性。

对开发者来说,成本优化是gpt-image-1.5的显著优势:相较于上一代gpt-image-1,新模型在图像输入和输出的计费方面降低了约20%。开发者仍然能够借助quality参数对生成成本进行精细把控,而OpenAI表示,即便处于较低的质量设置下,新模型依旧可以维持相当出色的生成效果。

面向普通用户群体,gpt-image-1.5已作为ChatGPT内置图像生成功能的底层驱动引擎。据OpenAI介绍,该模型能够在确保光线、构图、人物特征等细节大致稳定的基础上,完成精准的图像编辑操作;和上一代模型相比,它的性能最高提升了4倍,图像生成与编辑的响应速度也更为快捷。