Models
概览
GPT Image 2 是一款面向通用创意工作流的图像模型,适合高质量生成、较强的 prompt 跟随,以及需要更稳定图中文字表现的场景。
它更适合哪些任务
- 营销和品牌视觉
- 产品图与包装概念图
- UI mockup 和界面场景图
- 海报、卡片、菜单等带文字的视觉素材
- 透明背景素材与合成工作流
推荐的提示词结构
如果条件允许,尽量按这个顺序写:
- 主体
- 场景或环境
- 构图与镜头视角
- 光线和材质线索
- 必须出现的图中文字
示例:
一张高级产品图,一袋哑光黑色咖啡豆包装放在石质台面上,正面构图,柔和晨光,背景有轻微蒸汽。包装标签写着 'HOUSE BLEND'。
文字渲染建议
- 把必须出现的文案放进引号。
- 每块文字尽量短。
- 明确说明布局场景,例如海报、菜单板、价格卡、UI 界面。
- 如果文字对业务关键,发布前仍然要人工审核。
输出策略
low适合快速灵感探索。medium适合大多数 prompt 迭代。high留给最终导出或真正进入评审的版本。
尺寸与计费
公开接口里的 size 参数使用宽高比字符串,而不是像素尺寸。常用值包括:
1:13:44:34:55:416:99:162:33:221:99:211:22:1
积分消耗由 quality 决定:
low:每张 2 积分medium:每张 6 积分high:每张 12 积分
实际使用时,通常建议草稿阶段用 low,生产迭代用 medium,只有进入最终审核和发布的素材再切到 high。
常见限制
- 图内长段文字仍然不如短标题和短标签稳定。
- 对版式要求非常苛刻时,通常仍然需要多轮迭代。
- 敏感 prompt 可能因为安全策略被拦截或改写。