GPT-Image-2 图片生成与编辑 API 文档

概述

GPT-Image-2 是 OpenAI 推出的图片生成与编辑模型，支持文生图和基于参考图的图片编辑。本平台兼容 OpenAI 官方接口协议，可直接使用 OpenAI SDK 调用。

接口信息

项目	说明
接口协议	OpenAI 兼容
请求格式	`application/json`
认证方式	`Bearer Token`
超时建议	文生图 ≥ 30s，图片编辑 ≥ 60s

一、文生图

根据文本描述生成图片。

接口地址

POST /v1/images/generations

请求参数

字段	类型	必填	说明
model	String	是	模型名称：`gpt-image-2`
prompt	String	是	文本描述，最长 32000 个字符
size	String	否	输出尺寸，见下方尺寸表，默认 `auto`
n	Int	否	生成数量，1-10，默认 1
quality	String	否	画质：`low` / `medium` / `high` / `auto`（默认）
output_format	String	否	输出格式：`png` / `jpeg` / `webp`，默认 `png`
output_compression	Int	否	压缩级别 0-100，默认 100（仅 jpeg/webp）
background	String	否	背景：`transparent` / `opaque` / `auto`

请求示例

响应示例

{
  "created": 1780883026,
  "data": [
    {
      "url": "https://prod-ss-vidu.s3.cn-northwest-1.amazonaws.com.cn/..."
    }
  ],
  "output_format": "png",
  "quality": "low",
  "size": "1024x1024",
  "usage": {
    "input_tokens": 13,
    "output_tokens": 196,
    "total_tokens": 209
  }
}

二、图片编辑

基于参考图片进行编辑，支持多图参考、遮罩编辑。

接口地址

POST /v1/images/edits

请求参数

字段	类型	必填	说明
model	String	是	模型名称：`gpt-image-2`
images	Array	否	参考图片数组，格式见下方说明，最多 14 张
prompt	String	是	编辑描述，最长 32000 个字符
size	String	否	输出尺寸，见下方尺寸表，默认 `auto`
n	Int	否	生成数量，1-10，默认 1
quality	String	否	画质：`low` / `medium` / `high` / `auto`（默认）
output_format	String	否	输出格式：`png` / `jpeg` / `webp`，默认 `png`
output_compression	Int	否	压缩级别 0-100，默认 100（仅 jpeg/webp）
background	String	否	背景：`transparent` / `opaque` / `auto`
input_fidelity	String	否	与原图相似度：`high`（默认） / `low`
mask_url	String	否	遮罩图片 URL，用于指定需要修改的区域

images 字段格式

"images": [
  {"image_url": "https://example.com/image1.png"},
  {"image_url": "https://example.com/image2.png"}
]

注意： 仅支持公网可访问的图片 URL，不支持本地文件和 Base64 编码图片。

请求示例

遮罩编辑示例

通过 mask_url 指定遮罩图片，白色区域为需要修改的部分：

响应示例

{
  "created": 1780883810,
  "data": [
    {
      "url": "https://prod-ss-vidu.s3.cn-northwest-1.amazonaws.com.cn/..."
    }
  ],
  "output_format": "png",
  "quality": "low",
  "size": "1024x1024",
  "usage": {
    "input_tokens": 586,
    "output_tokens": 5488,
    "total_tokens": 6074
  }
}

支持的尺寸

尺寸	分辨率	宽高比
`1024x1024`	1K	1:1
`1024x768`	1K	4:3
`768x1024`	1K	3:4
`1536x1024`	1.5K	3:2
`1024x1536`	1.5K	2:3
`1920x1088`	1080P	16:9
`1088x1920`	1080P	9:16
`1920x816`	1080P	21:9
`816x1920`	1080P	9:21
`2048x2048`	2K	1:1
`2560x1440`	2K	16:9
`1440x2560`	2K	9:16
`2880x2880`	4K	1:1
`3840x2160`	4K	16:9
`2160x3840`	4K	9:16

宽高比不超过 3:1 或 1:3。传 auto 由模型自动选择尺寸。

计费说明

按 Token 用量计费：

类型	单价（每 1M Tokens）
文本输入	$5.00
图片输出	$30.00

参考费用（low 质量 1024x1024）：

文生图：约 $0.006 / 张

图片编辑：约 $0.02 / 张（含参考图 Token）

质量越高、尺寸越大，消耗 Token 越多，费用相应增加。

SDK 调用示例

Python（OpenAI SDK）

Node.js

注意事项

超时设置： 图片生成约 15-20 秒，图片编辑约 30-40 秒，建议设置 60 秒以上超时

图片格式： 图片编辑仅支持公网 URL，不支持本地文件和 Base64

请求格式： 文生图和图片编辑均使用 application/json 格式

返回格式： 默认返回图片 URL，设置 response_format: "b64_json" 可返回 Base64 编码

并发限制： 请勿频繁并发请求，建议控制在合理范围

错误码说明

HTTP 状态码	说明	处理方式
200	成功	-
400	请求参数错误	检查请求参数格式
401	认证失败	检查 API Key 是否正确
429	请求频率超限	降低请求频率或联系客服提升限额
500	服务器内部错误	稍后重试
503	无可用渠道	稍后重试或联系客服
524	请求超时	增加超时时间后重试

GPT-Image-2 图片生成与编辑 API 文档

概述#

接口信息#

一、文生图#

接口地址#

请求参数#

请求示例#

响应示例#

二、图片编辑#

接口地址#

请求参数#

images 字段格式#

请求示例#

遮罩编辑示例#

响应示例#

支持的尺寸#

计费说明#

SDK 调用示例#

Python（OpenAI SDK）#

Node.js#

注意事项#

错误码说明#

概述

接口信息

一、文生图

接口地址

请求参数

请求示例

响应示例

二、图片编辑

接口地址

请求参数

images 字段格式

请求示例

遮罩编辑示例

响应示例

支持的尺寸

计费说明

SDK 调用示例

Python（OpenAI SDK）

Node.js

注意事项

错误码说明