| 项目 | 说明 |
|---|---|
| 接口协议 | OpenAI 兼容 |
| 请求格式 | application/json |
| 认证方式 | Bearer Token |
| 超时建议 | 文生图 ≥ 30s,图片编辑 ≥ 60s |
POST /v1/images/generations| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| model | String | 是 | 模型名称:gpt-image-2 |
| prompt | String | 是 | 文本描述,最长 32000 个字符 |
| size | String | 否 | 输出尺寸,见下方尺寸表,默认 auto |
| n | Int | 否 | 生成数量,1-10,默认 1 |
| quality | String | 否 | 画质:low / medium / high / auto(默认) |
| output_format | String | 否 | 输出格式:png / jpeg / webp,默认 png |
| output_compression | Int | 否 | 压缩级别 0-100,默认 100(仅 jpeg/webp) |
| background | String | 否 | 背景:transparent / opaque / auto |
{
"created": 1780883026,
"data": [
{
"url": "https://prod-ss-vidu.s3.cn-northwest-1.amazonaws.com.cn/..."
}
],
"output_format": "png",
"quality": "low",
"size": "1024x1024",
"usage": {
"input_tokens": 13,
"output_tokens": 196,
"total_tokens": 209
}
}POST /v1/images/edits| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| model | String | 是 | 模型名称:gpt-image-2 |
| images | Array | 否 | 参考图片数组,格式见下方说明,最多 14 张 |
| prompt | String | 是 | 编辑描述,最长 32000 个字符 |
| size | String | 否 | 输出尺寸,见下方尺寸表,默认 auto |
| n | Int | 否 | 生成数 量,1-10,默认 1 |
| quality | String | 否 | 画质:low / medium / high / auto(默认) |
| output_format | String | 否 | 输出格式:png / jpeg / webp,默认 png |
| output_compression | Int | 否 | 压缩级别 0-100,默认 100(仅 jpeg/webp) |
| background | String | 否 | 背景:transparent / opaque / auto |
| input_fidelity | String | 否 | 与原图相似度:high(默认) / low |
| mask_url | String | 否 | 遮罩图片 URL,用于指定需要修改的区域 |
"images": [
{"image_url": "https://example.com/image1.png"},
{"image_url": "https://example.com/image2.png"}
]注意: 仅支持公网可访问的图片 URL,不支持本地文件和 Base64 编码图片。
mask_url 指定遮罩图片,白色区域为需要修改的部分:{
"created": 1780883810,
"data": [
{
"url": "https://prod-ss-vidu.s3.cn-northwest-1.amazonaws.com.cn/..."
}
],
"output_format": "png",
"quality": "low",
"size": "1024x1024",
"usage": {
"input_tokens": 586,
"output_tokens": 5488,
"total_tokens": 6074
}
}| 尺寸 | 分辨率 | 宽高比 |
|---|---|---|
1024x1024 | 1K | 1:1 |
1024x768 | 1K | 4:3 |
768x1024 | 1K | 3:4 |
1536x1024 | 1.5K | 3:2 |
1024x1536 | 1.5K | 2:3 |
1920x1088 | 1080P | 16:9 |
1088x1920 | 1080P | 9:16 |
1920x816 | 1080P | 21:9 |
816x1920 | 1080P | 9:21 |
2048x2048 | 2K | 1:1 |
2560x1440 | 2K | 16:9 |
1440x2560 | 2K | 9:16 |
2880x2880 | 4K | 1:1 |
3840x2160 | 4K | 16:9 |
2160x3840 | 4K | 9:16 |
宽高比不超过 3:1 或 1:3。传 auto由模型自动选择尺寸。
| 类型 | 单价(每 1M Tokens) |
|---|---|
| 文本输入 | $5.00 |
| 图片输出 | $30.00 |
质量越高、尺寸越大,消耗 Token 越多,费用相应增加。
application/json 格式response_format: "b64_json" 可返回 Base64 编码| HTTP 状态码 | 说明 | 处理方式 |
|---|---|---|
| 200 | 成功 | - |
| 400 | 请求参数错误 | 检查请求参数格式 |
| 401 | 认证失败 | 检查 API Key 是否正确 |
| 429 | 请求频率超限 | 降低请求频率或联系客服提升限额 |
| 500 | 服务器内部错误 | 稍后重试 |
| 503 | 无可用渠道 | 稍后重试 或联系客服 |
| 524 | 请求超时 | 增加超时时间后重试 |