gpt-image-1.5

模型描述

gpt-image-1.5-rev(每次 0.1)

gpt-image-1.5

OpenAI 正式推出了新版本的 ChatGPT 图像功能,采用其最新旗舰图像生成模型 GPT Image 1.5。该新模型设计大幅提升效率,图像生成速度比前一代快四倍。目前,该功能正在向所有 ChatGPT 用户逐步开放,用户可通过网页版和移动应用侧边栏中的专属“图像”空间访问。对于开发者,该模型以 GPT Image 1.5 的形式在 API 中提供,图像输入和输出的成本较上一版本降低了 20%。

此次更新的主要重点是能够在保持原始图像完整性的同时进行精确编辑。当用户请求对上传的照片进行更改时,模型能够更可靠地遵循他们的意图,仅修改指定区域,同时保持光线、构图和人物外观等元素的一致性。这一功能支持诸如虚拟试穿服装或发型以及保留原始素材精髓的概念性变换等实际应用。该模型擅长多种编辑任务,包括添加、删除、混合和转置元素,有效地充当一个便携式创意工作室。

在指令执行和文本渲染方面的技术改进进一步凸显了 GPT Image 1.5 的优势。该模型现在能够更准确地处理复杂的构图,例如生成特定的 6×6 多样化物体网格。文本渲染也有了显著提升,使模型能够更清晰地生成信息图表、图解或代码片段中密集且细小的文字。此外,此次更新还提升了整体图像质量,特别是在渲染自然场景和人群中众多小脸部细节方面,这些一直是生成模型的难点。

为了使创作过程更加便捷,OpenAI 在 ChatGPT 中引入了一个新的图像功能,包含预设滤镜和提示建议。虽然该模型在科学准确性和视觉生动性方面表现出显著提升,OpenAI 也指出它尚未完美;在多语言支持和特定复杂风格等方面仍存在局限。尽管面临这些挑战,该模型已被企业用于品牌一致的营销图形和电子商务目录,在多次迭代中保持视觉识别至关重要。

🔔如何使用

graph LR A("Purchase Now") --> B["Start Chat on Homepage"] A --> D["Read API Documentation"] B --> C["Register / Login"] C --> E["Enter Key"] D --> F["Enter Endpoint & Key"] E --> G("Start Using") F --> G style A fill:#f9f9f9,stroke:#333,stroke-width:1px style B fill:#f9f9f9,stroke:#333,stroke-width:1px style C fill:#f9f9f9,stroke:#333,stroke-width:1px style D fill:#f9f9f9,stroke:#333,stroke-width:1px style E fill:#f9f9f9,stroke:#333,stroke-width:1px style F fill:#f9f9f9,stroke:#333,stroke-width:1px style G fill:#f9f9f9,stroke:#333,stroke-width:1px

点击购买

点击首页立即对话

注册 / 登录

输入key

阅读API文档

输入端点和API Key

开始使用

全文结束

推荐模型

gemini-2.5-flash-lite-preview-06-17

一个针对成本效益和低延迟进行了优化的 Gemini 2.5 Flash 模型。

kimi-k2.5

Kimi K2.5 is a native multimodal model that significantly advances visual understanding and coding capabilities while introducing a revolutionary multi-agent swarm system for tackling complex, large-scale tasks.

az/claude-sonnet-4-20250514

微软azure平台提供的克劳德模型系列,稳定性适中,价格极低,更适合对稳定性要求不是特别严谨的数据批处理任务。