如何写好图片生成 Prompt:一篇掌握核心方法

发布时间:2026-03/6 分钟阅读
图片生成 Prompt 教程

如果 AI 生成结果总和你想象中的画面差很多,问题通常不是模型不够强,而是 Prompt 结构不够清楚。把主体、环境、风格、光线和技术细节拆开写,结果会稳定得多。

一个高质量 Prompt 的基础结构

无论你用 Midjourney、DALL-E 3 还是 Stable Diffusion,大多数高质量 Prompt 都可以拆成 5 个部分:

Prompt 结构示意图

推荐框架

  • 1. 主体:画面核心是什么,比如角色、产品、建筑或场景。
  • 2. 动作/环境:主体在做什么,位于什么空间。
  • 3. 风格/媒介:插画、油画、写实摄影、3D 渲染、动漫分镜等。
  • 4. 光线/氛围:逆光、柔光、体积光、冷暖色调、情绪关键词。
  • 5. 技术细节:焦距、镜头、景深、画幅比例、清晰度。

风格词为什么重要

模型并不擅长理解“酷一点”“高级一点”这种抽象词,但非常擅长理解具体的艺术流派、摄影语言、材质和导演风格。风格词越具体,结果越接近你的目标。

不同风格示例

不要只写“写实”

可以改成:写实摄影,Canon EOS R5 拍摄感,85mm 镜头,f/1.8,大光圈浅景深,电影级光线,清晰对焦,细节丰富

不要只写“像插画”

可以改成:吉卜力风格,传统水彩动画质感,平涂色块,干净线稿,柔和粉彩配色

不同平台的写法差异

Midjourney:更适合短语式、视觉碎片式 Prompt。

DALL-E 3 / GPT Image:更适合完整自然语言,像在给摄影师写需求。

Stable Diffusion:更依赖关键词和负面词,适合做精细控制。

最后的建议

不要一次改十几个词。最稳的方法是固定主体和场景,每次只调整一个变量,比如镜头、光线或风格词。这样你更容易找到真正影响成图质量的关键因素。