gpt-image-1.5

gpt-image-1.5-rev（每次 0.1）

gpt-image-1.5

OpenAI 正式推出了新版本的 ChatGPT 图像功能，采用其最新旗舰图像生成模型 GPT Image 1.5。该新模型设计大幅提升效率，图像生成速度比前一代快四倍。目前，该功能正在向所有 ChatGPT 用户逐步开放，用户可通过网页版和移动应用侧边栏中的专属“图像”空间访问。对于开发者，该模型以 GPT Image 1.5 的形式在 API 中提供，图像输入和输出的成本较上一版本降低了 20%。

此次更新的主要重点是能够在保持原始图像完整性的同时进行精确编辑。当用户请求对上传的照片进行更改时，模型能够更可靠地遵循他们的意图，仅修改指定区域，同时保持光线、构图和人物外观等元素的一致性。这一功能支持诸如虚拟试穿服装或发型以及保留原始素材精髓的概念性变换等实际应用。该模型擅长多种编辑任务，包括添加、删除、混合和转置元素，有效地充当一个便携式创意工作室。

在指令执行和文本渲染方面的技术改进进一步凸显了 GPT Image 1.5 的优势。该模型现在能够更准确地处理复杂的构图，例如生成特定的 6×6 多样化物体网格。文本渲染也有了显著提升，使模型能够更清晰地生成信息图表、图解或代码片段中密集且细小的文字。此外，此次更新还提升了整体图像质量，特别是在渲染自然场景和人群中众多小脸部细节方面，这些一直是生成模型的难点。

为了使创作过程更加便捷，OpenAI 在 ChatGPT 中引入了一个新的图像功能，包含预设滤镜和提示建议。虽然该模型在科学准确性和视觉生动性方面表现出显著提升，OpenAI 也指出它尚未完美；在多语言支持和特定复杂风格等方面仍存在局限。尽管面临这些挑战，该模型已被企业用于品牌一致的营销图形和电子商务目录，在多次迭代中保持视觉识别至关重要。

模型描述