Skip to main content
通过 即刻API 直连 Google Vertex AI,使用 Gemini 3.1 Flash Image 原生 API 生成图像。提交请求后返回异步任务对象,使用任务 ID 轮询 GET /v1/images/generations/{task_id} 查询结果。
重要变更:为了更好的性能和成本控制,我们不再支持在 image_urls 中直接传入 base64 图片数据。请先使用上传图片接口上传图片,获取 URL 后再调用本接口。
与标准版相比,官方直连版本额外支持 thinkingConfig 思考模式、极端宽高比(4:18:1)以及更多原生 Vertex AI 参数控制。

请求参数

model
string
default:"gemini-3.1-flash-image-preview-official"
required
图像生成模型名称。示例:"gemini-3.1-flash-image-preview-official"
prompt
string
required
图像生成的文本描述。示例:"一幅水墨画风格的山水景观,远山层叠,云雾缭绕"
size
string
图像宽高比。支持的格式:
  • 1:1 — 正方形
  • 3:2 / 2:3
  • 3:4 / 4:3
  • 4:5 / 5:4
  • 9:16 / 16:9
  • 21:9
  • 4:1 / 8:1 — 极端宽屏比例
n
integer
default:"1"
生成图像的数量。固定为 1。
image_urls
string[]
参考图像 URL 数组,用于图生图或图像编辑。⚠️ 仅支持 URL 格式(不再支持 base64)
  • 公开可访问的图片 URL(http://https://
  • 可使用上传图片接口上传本地图片获取 URL
限制:
  • 最多 14 张图片
  • 单张图片不得超过 10MB
  • 支持格式:.jpeg、.jpg、.png、.webp
metadata
object
Vertex AI 原生扩展参数。
metadata.temperature
number
生成温度,控制输出的随机性。取值范围:0.0 - 2.0,默认 1.0
metadata.topP
number
Top-P 采样参数。取值范围:0.0 - 1.0,默认 0.95
metadata.maxOutputTokens
integer
最大输出 token 数。默认 32768
metadata.resolution
string
输出图像分辨率,后端自动映射为 Vertex AI 原生 imageSize。可选值:1K2K4K,默认 1K
metadata.personGeneration
string
人物生成控制。可选值:
  • ALLOW_ALL — 允许生成所有人物(包括成人和儿童)
  • ALLOW_ADULT — 仅允许生成成人
  • ALLOW_NONE — 禁止生成人物
metadata.imageOutputOptions
object
图像输出格式配置。
  • mimeType(字符串):输出图像格式,可选 image/pngimage/jpegimage/webp
  • compressionQuality(整数):压缩质量(仅 JPEG 有效)
metadata.thinkingConfig
object
思考模式配置。启用后模型会先进行推理再生成图像,适合复杂场景。
  • thinkingBudget(整数):思考 token 预算,取值范围 0 - 24576,默认由模型自动决定
  • thinkingLevel(字符串):思考级别,可选 LOWMEDIUMHIGHMINIMAL
metadata.safetySettings
array
安全设置数组,控制内容安全过滤级别。每个元素包含:
  • category(字符串):安全类别,可选 HARM_CATEGORY_HATE_SPEECHHARM_CATEGORY_DANGEROUS_CONTENTHARM_CATEGORY_SEXUALLY_EXPLICITHARM_CATEGORY_HARASSMENT
  • threshold(字符串):过滤阈值,可选 OFFBLOCK_LOW_AND_ABOVEBLOCK_MEDIUM_AND_ABOVEBLOCK_ONLY_HIGH

请求示例

curl --request POST \
  --url https://geekapis.com/v1/images/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "gemini-3.1-flash-image-preview-official",
    "prompt": "一幅水墨画风格的山水景观,远山层叠,云雾缭绕",
    "size": "16:9",
    "n": 1,
    "metadata": {
      "temperature": 1.0,
      "topP": 0.95,
      "resolution": "1K",
      "personGeneration": "ALLOW_ALL",
      "thinkingConfig": {
        "thinkingLevel": "HIGH"
      }
    }
  }'

响应示例

{
  "id": "task_img_abc123def456",
  "object": "generation.task",
  "model": "gemini-3.1-flash-image-preview-official",
  "status": "queued",
  "progress": 0,
  "created_at": 1703884800,
  "metadata": {}
}

响应字段

字段类型说明
idstring任务唯一标识符,用于查询任务状态
objectstring对象类型,固定为 generation.task
modelstring使用的模型名称
statusstring任务状态:queuedin_progresscompletedfailed
progressinteger任务进度(0-100),提交时通常为 0
created_atinteger任务创建时间戳(Unix 时间戳)
metadataobject任务元数据