Skip to main content

接口说明

端点: POST https://geekapis.com/v1/images/generations 本通道直接转发至 OpenAI 官方 gpt-image-2 模型,适合对原生模型效果有严格要求的业务场景。支持以下功能:
  • 文生图:根据 prompt 创作全新图像
  • 图生图(多参考图):提供最多 16 张参考图,融合风格和内容生成
  • 局部重绘(inpainting):通过 mask_url 精确控制重绘区域
接口采用异步任务模式,请求成功后立即返回任务对象,需通过 GET https://geekapis.com/v1/images/generations/{task_id} 轮询状态。
透明背景不受支持gpt-image-2 官方通道不支持透明背景(background: "transparent")。若传入此参数,系统将静默降级background: "auto",不会报错,但输出图像将带有不透明背景。请勿依赖透明背景功能。

请求参数

认证

所有请求须在 Header 中携带 Bearer Token:
Authorization: Bearer YOUR_API_KEY
前往 API Key 管理页面 获取您的密钥。

Body 参数

model
string
required
图像生成模型名称。固定填写 gpt-image-2
prompt
string
required
图像生成的文字描述。支持中英文,建议详细描述场景、风格和构图。
size
string
画面宽高比。默认值:"1:1"。也可传 "auto" 由服务端自动选择。可用值取决于 resolution
  • 1K / 2K1:1 · 3:2 · 2:3 · 4:3 · 3:4 · 5:4 · 4:5 · 16:9 · 9:16 · 2:1 · 1:2 · 21:9 · 9:21
  • 4K:仅支持 16:9 · 9:16 · 2:1 · 1:2 · 21:9 · 9:21
resolution
string
分辨率档位。默认值:"1K"
  • 1K — 1024 基准,速度快,日常使用(默认)
  • 2K — 2048 基准,适合海报与高清展示
  • 4K — 3840 基准,仅支持 6 种比例;high 质量下耗时可达 130 秒
quality
string
图片质量。默认值:"high"
  • low — 快速省成本,适合草稿/预览
  • medium — 平衡速度与质量
  • high — 最高精度(默认);4K + high 组合下生成时间可达 130 秒,请注意超时设置
output_format
string
输出文件格式。默认值:"png"
  • png — 无损,适合需要高质量存档
  • jpeg — 文件更小,支持压缩率控制
注意:不支持 "webp" 格式(Azure OpenAI 后端限制)。
output_compression
integer
JPEG 压缩强度,范围 01000 最低压缩,100 最大压缩)。默认值:100仅对 output_format: "jpeg" 生效。
n
integer
生成图像数量,范围 110。默认值:1。单次最多生成 4 张图(官方通道限制)。
image_urls
string[]
参考图 URL 数组,用于图生图模式。
  • 最多 16 张
  • 须为公网可访问的稳定 URL(PNG / JPG,单张 ≤ 50MB)
  • 可先使用上传图片接口获取 URL
mask_url
string
遮罩图 URL,用于局部重绘(inpainting)。须搭配 image_urls 使用。
  • 必须为 PNG 格式,含 Alpha 通道
  • 透明区域 为重绘区域,不透明区域 保持原样
  • 尺寸须与第一张参考图完全一致
4K 高质量生成耗时说明:使用 resolution: "4K" + quality: "high" 组合时,单张图像生成时间可达 130 秒。请确保您的客户端轮询超时时间足够长(建议 ≥ 180 秒),避免因超时丢失任务结果。

代码示例

curl --request POST \
  --url https://geekapis.com/v1/images/generations \
  --header 'Authorization: Bearer YOUR_API_KEY' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "gpt-image-2",
    "prompt": "星空下的古老城堡,电影感光影,超写实风格",
    "size": "16:9",
    "resolution": "2K",
    "quality": "high",
    "n": 1
  }'

响应示例

200 OK
{
  "id": "tsk_img_01KPTXXXXXXXXXXXXXXX",
  "object": "generation.task",
  "model": "gpt-image-2",
  "status": "queued",
  "progress": 0,
  "created_at": 1703884800,
  "metadata": {}
}

响应字段说明

字段类型说明
idstring任务唯一标识符,用于轮询结果
objectstring固定为 "generation.task"
modelstring本次使用的模型名称
statusstring任务状态:queued / in_progress / completed / failed
progressinteger完成进度(0–100)
created_atinteger任务创建时间(Unix 时间戳)

尺寸对照表

比例1K 像素尺寸2K 像素尺寸4K 像素尺寸
1:11024 × 10242048 × 2048不支持
3:21536 × 10242048 × 1360不支持
2:31024 × 15361360 × 2048不支持
4:31024 × 7682048 × 1536不支持
3:4768 × 10241536 × 2048不支持
5:41280 × 10242560 × 2048不支持
4:51024 × 12802048 × 2560不支持
16:91536 × 8642048 × 11523840 × 2160
9:16864 × 15361152 × 20482160 × 3840
2:12048 × 10242688 × 13443840 × 1920
1:21024 × 20481344 × 26881920 × 3840
21:92016 × 8642688 × 11523840 × 1648
9:21864 × 20161152 × 26881648 × 3840

错误码说明

HTTP 状态码错误类型说明
400Bad Request参数有误,如 sizeresolution 组合不合法
401UnauthorizedAPI Key 无效或未提供
422Unprocessable Entity参数值不合法(如 base64 图片被拒绝,或遮罩图尺寸不匹配)
429Too Many Requests请求频率超限,请稍后重试
500Internal Server Error服务端异常,请重试或联系支持