Models

概览

GPT Image 2 是一款面向通用创意工作流的图像模型,适合高质量生成、较强的 prompt 跟随,以及需要更稳定图中文字表现的场景。

它更适合哪些任务

  • 营销和品牌视觉
  • 产品图与包装概念图
  • UI mockup 和界面场景图
  • 海报、卡片、菜单等带文字的视觉素材
  • 透明背景素材与合成工作流

推荐的提示词结构

如果条件允许,尽量按这个顺序写:

  1. 主体
  2. 场景或环境
  3. 构图与镜头视角
  4. 光线和材质线索
  5. 必须出现的图中文字

示例:

一张高级产品图,一袋哑光黑色咖啡豆包装放在石质台面上,正面构图,柔和晨光,背景有轻微蒸汽。包装标签写着 'HOUSE BLEND'。

文字渲染建议

  • 把必须出现的文案放进引号。
  • 每块文字尽量短。
  • 明确说明布局场景,例如海报、菜单板、价格卡、UI 界面。
  • 如果文字对业务关键,发布前仍然要人工审核。

输出策略

  • low 适合快速灵感探索。
  • medium 适合大多数 prompt 迭代。
  • high 留给最终导出或真正进入评审的版本。

尺寸与计费

公开接口里的 size 参数使用宽高比字符串,而不是像素尺寸。常用值包括:

  • 1:1
  • 3:4
  • 4:3
  • 4:5
  • 5:4
  • 16:9
  • 9:16
  • 2:3
  • 3:2
  • 21:9
  • 9:21
  • 1:2
  • 2:1

积分消耗由 quality 决定:

  • low:每张 2 积分
  • medium:每张 6 积分
  • high:每张 12 积分

实际使用时,通常建议草稿阶段用 low,生产迭代用 medium,只有进入最终审核和发布的素材再切到 high。

常见限制

  • 图内长段文字仍然不如短标题和短标签稳定。
  • 对版式要求非常苛刻时,通常仍然需要多轮迭代。
  • 敏感 prompt 可能因为安全策略被拦截或改写。

相关页面