GPT Image 2

Models

概览

GPT Image 2 是一款面向通用创意工作流的图像模型，适合高质量生成、较强的 prompt 跟随，以及需要更稳定图中文字表现的场景。

它更适合哪些任务

营销和品牌视觉
产品图与包装概念图
UI mockup 和界面场景图
海报、卡片、菜单等带文字的视觉素材
透明背景素材与合成工作流

推荐的提示词结构

如果条件允许，尽量按这个顺序写：

主体
场景或环境
构图与镜头视角
光线和材质线索
必须出现的图中文字

示例：

一张高级产品图，一袋哑光黑色咖啡豆包装放在石质台面上，正面构图，柔和晨光，背景有轻微蒸汽。包装标签写着 'HOUSE BLEND'。

文字渲染建议

把必须出现的文案放进引号。
每块文字尽量短。
明确说明布局场景，例如海报、菜单板、价格卡、UI 界面。
如果文字对业务关键，发布前仍然要人工审核。

输出策略

low 适合快速灵感探索。
medium 适合大多数 prompt 迭代。
high 留给最终导出或真正进入评审的版本。

尺寸与计费

公开接口里的 size 参数使用宽高比字符串，而不是像素尺寸。常用值包括：

1:1
3:4
4:3
4:5
5:4
16:9
9:16
2:3
3:2
21:9
9:21
1:2
2:1

积分消耗由 quality 决定：

low：每张 2 积分
medium：每张 6 积分
high：每张 12 积分

实际使用时，通常建议草稿阶段用 low，生产迭代用 medium，只有进入最终审核和发布的素材再切到 high。

常见限制

图内长段文字仍然不如短标题和短标签稳定。
对版式要求非常苛刻时，通常仍然需要多轮迭代。
敏感 prompt 可能因为安全策略被拦截或改写。

相关页面

GPT Image 2 图片编辑

使用 GPT Image 2 编辑、改造或组合已有图片

On this page

它更适合哪些任务

推荐的提示词结构

文字渲染建议

尺寸与计费