GET /v1/images/generations/{task_id} 查询结果。
重要变更:为了更好的性能和成本控制,我们不再支持在 image_urls 中直接传入 base64 图片数据。请先使用上传图片接口上传图片,获取 URL 后再调用本接口。
Gemini 3.1 Flash 图像模型支持文生图、图生图,最多 14 张参考图,并集成 Google Search 搜索增强,可生成更贴合真实世界信息的图像。支持包括 1:4、8:1 在内的极端宽高比。
请求参数
图像生成模型名称。示例:
"gemini-3.1-flash-image-preview"图像生成的文本描述。示例:
"赛博朋克风格的城市夜景,霓虹灯闪烁"图像生成的宽高比。支持的比例:
| 值 | 适用场景 |
|---|---|
1:1 | 方形图、头像、社交媒体 |
3:2 / 2:3 | 标准照片 |
4:3 / 3:4 | 传统显示器比例 |
16:9 / 9:16 | 宽屏/竖屏视频封面 |
5:4 / 4:5 | Instagram 图片 |
21:9 | 超宽屏 Banner |
1:4 / 4:1 | 长条海报/横幅 |
1:8 / 8:1 | 极端长图/横幅广告 |
生成图像的数量。⚠️ 注意: 必须是纯数字(如
1),不要加引号,否则会报错。参考图像 URL 列表,用于图生图或图像编辑。每个元素包含:
url(必填):公开可访问的图片 URL(http://或https://)
- 最多 14 张图片(建议:最多 10 张物体参考 + 4 张角色参考)
- 单张图片不得超过 10MB
- 支持格式:.jpeg、.jpg、.png、.webp
元数据参数,用于传递额外的配置选项。
输出图像分辨率。支持的值:
0.5K— 约 512px,低分辨率预览1K— 约 1024px,标准分辨率(默认)2K— 约 2048px,高分辨率4K— 约 4096px,超高分辨率
启用 Google 文字搜索增强。
true:模型会先搜索网络文字信息来辅助生成图片,适合需要真实信息的场景false:不启用(默认)
启用 Google 图片搜索增强。
true:除了文字搜索,还会搜索参考图片来辅助生成,适合需要视觉参考的场景false:不启用(默认)
google_search: true 一起使用。请求示例
响应示例
响应字段
| 字段 | 类型 | 说明 |
|---|---|---|
id | string | 任务唯一标识符,用于查询任务状态 |
object | string | 对象类型,固定为 generation.task |
model | string | 使用的模型名称 |
status | string | 任务状态:queued、in_progress、completed、failed |
progress | integer | 任务进度(0-100),提交时通常为 0 |
created_at | integer | 任务创建时间戳(Unix 时间戳) |
metadata | object | 任务元数据 |
