Gemini 3.1 Flash 官方直连 | Vertex AI 极端宽高比

通过即刻API 直连 Google Vertex AI，使用 Gemini 3.1 Flash Image 原生 API 生成图像。提交请求后返回异步任务对象，使用任务 ID 轮询 GET /v1/images/generations/{task_id} 查询结果。

重要变更：为了更好的性能和成本控制，我们不再支持在 image_urls 中直接传入 base64 图片数据。请先使用上传图片接口上传图片，获取 URL 后再调用本接口。

与标准版相比，官方直连版本额外支持 thinkingConfig 思考模式、极端宽高比（4:1、8:1）以及更多原生 Vertex AI 参数控制。

请求参数

model

string

default:"gemini-3.1-flash-image-preview-official"

required

图像生成模型名称。示例："gemini-3.1-flash-image-preview-official"

prompt

string

required

图像生成的文本描述。示例："一幅水墨画风格的山水景观，远山层叠，云雾缭绕"

size

string

图像宽高比。支持的格式：

1:1 — 正方形
3:2 / 2:3
3:4 / 4:3
4:5 / 5:4
9:16 / 16:9
21:9
4:1 / 8:1 — 极端宽屏比例

integer

default:"1"

生成图像的数量。固定为 1。

image_urls

string[]

参考图像 URL 数组，用于图生图或图像编辑。⚠️ 仅支持 URL 格式（不再支持 base64）

公开可访问的图片 URL（http:// 或 https://）
可使用上传图片接口上传本地图片获取 URL

限制：

最多 14 张图片
单张图片不得超过 10MB
支持格式：.jpeg、.jpg、.png、.webp

metadata

object

Vertex AI 原生扩展参数。

metadata.temperature

number

生成温度，控制输出的随机性。取值范围：0.0 - 2.0，默认 1.0。

metadata.topP

number

Top-P 采样参数。取值范围：0.0 - 1.0，默认 0.95。

metadata.maxOutputTokens

integer

最大输出 token 数。默认 32768。

metadata.resolution

string

输出图像分辨率，后端自动映射为 Vertex AI 原生 imageSize。可选值：1K、2K、4K，默认 1K。

metadata.personGeneration

string

人物生成控制。可选值：

ALLOW_ALL — 允许生成所有人物（包括成人和儿童）
ALLOW_ADULT — 仅允许生成成人
ALLOW_NONE — 禁止生成人物

metadata.imageOutputOptions

object

图像输出格式配置。

mimeType（字符串）：输出图像格式，可选 image/png、image/jpeg、image/webp
compressionQuality（整数）：压缩质量（仅 JPEG 有效）

metadata.thinkingConfig

object

思考模式配置。启用后模型会先进行推理再生成图像，适合复杂场景。

thinkingBudget（整数）：思考 token 预算，取值范围 0 - 24576，默认由模型自动决定
thinkingLevel（字符串）：思考级别，可选 LOW、MEDIUM、HIGH、MINIMAL

metadata.safetySettings

array

安全设置数组，控制内容安全过滤级别。每个元素包含：

category（字符串）：安全类别，可选 HARM_CATEGORY_HATE_SPEECH、HARM_CATEGORY_DANGEROUS_CONTENT、HARM_CATEGORY_SEXUALLY_EXPLICIT、HARM_CATEGORY_HARASSMENT
threshold（字符串）：过滤阈值，可选 OFF、BLOCK_LOW_AND_ABOVE、BLOCK_MEDIUM_AND_ABOVE、BLOCK_ONLY_HIGH

请求示例

curl --request POST \
  --url https://geekapis.com/v1/images/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "gemini-3.1-flash-image-preview-official",
    "prompt": "一幅水墨画风格的山水景观，远山层叠，云雾缭绕",
    "size": "16:9",
    "n": 1,
    "metadata": {
      "temperature": 1.0,
      "topP": 0.95,
      "resolution": "1K",
      "personGeneration": "ALLOW_ALL",
      "thinkingConfig": {
        "thinkingLevel": "HIGH"
      }
    }
  }'

响应示例

{
  "id": "task_img_abc123def456",
  "object": "generation.task",
  "model": "gemini-3.1-flash-image-preview-official",
  "status": "queued",
  "progress": 0,
  "created_at": 1703884800,
  "metadata": {}
}

响应字段

字段	类型	说明
`id`	string	任务唯一标识符，用于查询任务状态
`object`	string	对象类型，固定为 `generation.task`
`model`	string	使用的模型名称
`status`	string	任务状态：`queued`、`in_progress`、`completed`、`failed`
`progress`	integer	任务进度（0-100），提交时通常为 `0`
`created_at`	integer	任务创建时间戳（Unix 时间戳）
`metadata`	object	任务元数据

​请求参数

​请求示例

​响应示例

​响应字段

请求参数

请求示例

响应示例

响应字段