lluu.ai
    • Quickstart
    • Claude code 接入说明
    • CC Switch - AI CLI 统一管理工具
    • OpenClaw - 自托管 AI 智能助手平台
    • GPT-Image-2 图片生成与编辑 API 文档
    • Google Veo 视频生成 API 文档

    GPT-Image-2 图片生成与编辑 API 文档

    概述#

    GPT-Image-2 是 OpenAI 推出的图片生成与编辑模型,支持文生图和基于参考图的图片编辑。本平台兼容 OpenAI 官方接口协议,可直接使用 OpenAI SDK 调用。

    接口信息#

    项目说明
    接口协议OpenAI 兼容
    请求格式application/json
    认证方式Bearer Token
    超时建议文生图 ≥ 30s,图片编辑 ≥ 60s

    一、文生图#

    根据文本描述生成图片。

    接口地址#

    POST /v1/images/generations

    请求参数#

    字段类型必填说明
    modelString是模型名称:gpt-image-2
    promptString是文本描述,最长 32000 个字符
    sizeString否输出尺寸,见下方尺寸表,默认 auto
    nInt否生成数量,1-10,默认 1
    qualityString否画质:low / medium / high / auto(默认)
    output_formatString否输出格式:png / jpeg / webp,默认 png
    output_compressionInt否压缩级别 0-100,默认 100(仅 jpeg/webp)
    backgroundString否背景:transparent / opaque / auto

    请求示例#

    响应示例#

    {
      "created": 1780883026,
      "data": [
        {
          "url": "https://prod-ss-vidu.s3.cn-northwest-1.amazonaws.com.cn/..."
        }
      ],
      "output_format": "png",
      "quality": "low",
      "size": "1024x1024",
      "usage": {
        "input_tokens": 13,
        "output_tokens": 196,
        "total_tokens": 209
      }
    }

    二、图片编辑#

    基于参考图片进行编辑,支持多图参考、遮罩编辑。

    接口地址#

    POST /v1/images/edits

    请求参数#

    字段类型必填说明
    modelString是模型名称:gpt-image-2
    imagesArray否参考图片数组,格式见下方说明,最多 14 张
    promptString是编辑描述,最长 32000 个字符
    sizeString否输出尺寸,见下方尺寸表,默认 auto
    nInt否生成数量,1-10,默认 1
    qualityString否画质:low / medium / high / auto(默认)
    output_formatString否输出格式:png / jpeg / webp,默认 png
    output_compressionInt否压缩级别 0-100,默认 100(仅 jpeg/webp)
    backgroundString否背景:transparent / opaque / auto
    input_fidelityString否与原图相似度:high(默认) / low
    mask_urlString否遮罩图片 URL,用于指定需要修改的区域

    images 字段格式#

    "images": [
      {"image_url": "https://example.com/image1.png"},
      {"image_url": "https://example.com/image2.png"}
    ]
    注意: 仅支持公网可访问的图片 URL,不支持本地文件和 Base64 编码图片。

    请求示例#

    遮罩编辑示例#

    通过 mask_url 指定遮罩图片,白色区域为需要修改的部分:

    响应示例#

    {
      "created": 1780883810,
      "data": [
        {
          "url": "https://prod-ss-vidu.s3.cn-northwest-1.amazonaws.com.cn/..."
        }
      ],
      "output_format": "png",
      "quality": "low",
      "size": "1024x1024",
      "usage": {
        "input_tokens": 586,
        "output_tokens": 5488,
        "total_tokens": 6074
      }
    }

    支持的尺寸#

    尺寸分辨率宽高比
    1024x10241K1:1
    1024x7681K4:3
    768x10241K3:4
    1536x10241.5K3:2
    1024x15361.5K2:3
    1920x10881080P16:9
    1088x19201080P9:16
    1920x8161080P21:9
    816x19201080P9:21
    2048x20482K1:1
    2560x14402K16:9
    1440x25602K9:16
    2880x28804K1:1
    3840x21604K16:9
    2160x38404K9:16
    宽高比不超过 3:1 或 1:3。传 auto 由模型自动选择尺寸。

    计费说明#

    按 Token 用量计费:
    类型单价(每 1M Tokens)
    文本输入$5.00
    图片输出$30.00
    参考费用(low 质量 1024x1024):
    文生图:约 $0.006 / 张
    图片编辑:约 $0.02 / 张(含参考图 Token)
    质量越高、尺寸越大,消耗 Token 越多,费用相应增加。

    SDK 调用示例#

    Python(OpenAI SDK)#

    Node.js#


    注意事项#

    1.
    超时设置: 图片生成约 15-20 秒,图片编辑约 30-40 秒,建议设置 60 秒以上超时
    2.
    图片格式: 图片编辑仅支持公网 URL,不支持本地文件和 Base64
    3.
    请求格式: 文生图和图片编辑均使用 application/json 格式
    4.
    返回格式: 默认返回图片 URL,设置 response_format: "b64_json" 可返回 Base64 编码
    5.
    并发限制: 请勿频繁并发请求,建议控制在合理范围

    错误码说明#

    HTTP 状态码说明处理方式
    200成功-
    400请求参数错误检查请求参数格式
    401认证失败检查 API Key 是否正确
    429请求频率超限降低请求频率或联系客服提升限额
    500服务器内部错误稍后重试
    503无可用渠道稍后重试或联系客服
    524请求超时增加超时时间后重试
    修改于 2026-06-09 06:11:23
    上一页
    OpenClaw - 自托管 AI 智能助手平台
    下一页
    Google Veo 视频生成 API 文档
    Built with