这是 basic/gemini-2.5-flash-image-preview,相同的图像质量,价格更低。
如何使用?
- 打开此网址: https://aiview.gongxiangai.top
- 设置您的 API 以开始使用。
介绍 Gemini 2.5 Flash 图像
2025 年 8 月 26 日,宣布推出 Gemini 2.5 Flash Image(又名纳米香蕉),这是一款专为图像生成和编辑而设计的最先进的模型。该模型引入了多项关键功能,包括将多个图像混合到单个图像中的能力、保持讲故事的角色一致性、使用自然语言执行有针对性的编辑以及利用 Gemini 的世界知识进行生成和编辑任务的能力。
此版本基于 Gemini 2.0 Flash 中首次推出的原生映像生成功能。虽然用户赞赏以前版本的低延迟、成本效益和易用性,但反馈表明需要更高质量的图像和更强大的创意控制,而这个新模型旨在解决这些问题。
可用性和定价
Gemini 2.5 Flash Image 可立即通过 Gemini API 和 Google AI Studio 供开发者使用,并通过 Vertex AI 供企业使用。定价为每 100 万个输出代币 30.00 美元。由于每个生成的图像对应于 1290 个输出代币,因此每张图像的成本约为 0.039 美元。所有其他输入和输出模式的定价与标准 Gemini 2.5 Flash 定价结构一致。
Google AI Studio 中的开发者体验
为了方便使用新模型进行构建,Google AI Studio 的“构建模式”进行了重大更新。开发者可以通过自定义的 AI 驱动应用快速测试模型能力,重新混合现有模板,或仅用一个提示词就将新想法变为现实。应用准备就绪后,可以直接从 Google AI Studio 部署,或将其代码保存到 GitHub。
关键模型功能
保持角色一致性图像生成中的一个常见挑战是在多个图像中保留角色的外观。Gemini 2.5 Flash Image 通过允许用户将相同的角色放置在不同的环境中、在新环境中从不同角度展示产品或生成一致的品牌资产来解决这个问题。该模型还擅长遵守视觉模板,使其可用于从单个设计创建房地产列表卡、统一员工徽章或动态产品模型等项目。
基于提示的图像编辑该模型通过自然语言指令实现精确、本地化的编辑。用户可以通过简单的提示执行有针对性的转换,例如模糊图像背景、去除 T 恤上的污渍、从照片中删除人物、改变拍摄对象的姿势或为黑白图片添加颜色。
本土世界知识与通常只关注美学的传统图像生成模型不同,Gemini 2.5 Flash Image 受益于 Gemini 对现实世界的深刻语义理解。这种世界知识的整合开启了新的用例。例如,它可以为交互式教育工具提供支持,该工具可以阅读和理解手绘图表,协助解决现实世界的问题,并在一个步骤中遵循复杂的编辑说明。
多图像融合Gemini 2.5 Flash Image 能够理解和合并多个输入图像。这允许用户将对象无缝放置到新场景中,使用不同的配色方案或纹理重新设计房间,或者使用单个提示将多个图像融合在一起以创建新的逼真的图像。