news 2026/6/21 8:35:40

AI画图总是翻车?5个万能prompt公式,告别「手指多一根、文字全乱码」

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI画图总是翻车?5个万能prompt公式,告别「手指多一根、文字全乱码」

我用 AI 画图的第一周,差点把电脑砸了。

需求很简单:画一只猫在沙滩上。结果出来的东西——猫有六条腿、沙滩是紫色的、猫的脸上写着歪歪扭扭的"CAT"。不是,我是让你画猫,不是让你造外星生物啊。

后来我发现,问题不在 AI,在我。我说的话太"人"了,AI 听不懂。

花了三个月摸索,我总结了 5 个 prompt 公式。不管你用 GPT-Image、Midjourney 还是其他工具,这 5 个模板基本能覆盖 90% 的场景。

为什么你写的 prompt 老是翻车

先讲原理。AI 画图模型理解 prompt 的方式,跟你理解的完全不一样。

你说"画一个温馨的下午",它不知道什么叫"温馨"。你得告诉它:浅黄色阳光、木质餐桌、一杯冒着热气的咖啡。

AI 需要具体的视觉元素,不是抽象的感觉。

这就是为什么新手和老手的 prompt 差别这么大:

❌ 新手: 画一个好看的女生头像 ✅ 老手: 正面半身肖像,年轻亚洲女性,黑色长发,柔和自然光 从左侧打来,浅灰色背景,皮肤质感细腻,佳能85mm镜头, 浅景深,日系清新风格

看出区别了吗?老手的 prompt 像一份视觉元素清单,而不是一句话描述。

5 个万能 prompt 公式

公式一:基础万能结构

[画风/风格] + [主体描述] + [构图/视角] + [色彩/光线] + [画质参数]

示例(公众号封面图):

扁平商业插画风格,一位程序员坐在电脑前敲代码, 中景构图、正面视角,白色和蓝色为主色调、 明亮的室内光线,极简设计、清晰边缘、 矢量风格

这个公式适合 70% 的日常需求。记住五个要素的顺序,每次写 prompt 都按这个过一遍。

公式二:摄影写真型

[拍摄类型] of [主体], [姿势/动作], [场景], [灯光设置], [相机型号], [镜头参数], [色调风格] --ar [比例]

示例(小红书头像):

Fashion portrait of a 25-year-old woman, smiling slightly, sitting by a window, soft natural window light from right side, shot on Canon EOS R5, 85mm f/1.2 lens, shallow depth of field, warm tone, Korean aesthetic style --ar 3:4

注意这个 prompt 是英文的。实测发现,摄影类 prompt 用英文效果明显比中文好。可能是训练数据里英文摄影术语更多。

公式三:产品/电商型

[产品类型] in [场景], [材质/质感], [角度/构图], [灯光], [背景颜色], commercial photography, studio lighting, product shot

示例(电商白底图):

Wireless bluetooth earphones on a white marble surface, glossy white plastic texture, top-down view, soft studio lighting, pure white background, commercial photography, minimalist product shot

这个公式我用了大概 50 次,出图稳定率在 85% 以上。关键是"commercial photography"和"studio lighting"这两个词,能显著提升产品质感。

公式四:插画/海报型

[插画风格] illustration, [主题元素], [色彩方案], [构图方式], [用途说明], flat design/vector art style

示例(知识卡片插图):

Minimalist flat illustration, a lightbulb with gears inside representing creative thinking, yellow and navy blue color scheme, centered composition, for educational infographic card, clean vector art style with bold outlines

公式五:场景叙事型(最灵活)

这个公式不固定结构,但遵循一个原则:按"摄像头"的逻辑来描述。

想象你是导演,在给摄影师讲分镜:

  1. 镜头位置:从哪看?(正上方俯拍 / 斜45度 / 正面平视)
  2. 镜头焦段:广角拍全景还是长焦拍特写?
  3. 画面内容:什么人在做什么事?
  4. 环境:在哪里?什么光线?什么颜色?
  5. 氛围:想传达什么感觉?

示例(文章配图):

Overhead flat lay shot, a desk setup with laptop, notebook, and a cup of coffee, warm morning sunlight from window casting soft shadows, organized creative chaos vibe, top-down view, minimalist wooden desk surface

这个公式最难掌握,但一旦熟练了,是五个里最好用的。因为它产出的图片最有故事感,不像"AI 生成的"。

万能避坑词

不管用什么公式,这三组词基本能解决 80% 的翻车问题:

防止文字翻车

如果你不想要画面里有文字,一定要加:

no text, no words, no letters, no watermarks

这个很重要!AI 默认很喜欢在画面里加文字,而且加出来的基本是乱码。

防止人物翻车

画人物时必加:

anatomically correct hands, five fingers on each hand, natural facial proportions, symmetrical face

"手指多一根"是整个 AI 画图界的老大难问题。GPT-Image 2 已经好很多了,但偶尔还是会翻车。

防止画风翻车

如果出来的风格不是你想要的:

--no 3D, --no realistic (排除3D写实) --no cartoon, --no anime (排除卡通动漫)

打标签的方式排除不需要的风格,比描述你想要的风格更有效。

直接可抄的 5 个 prompt

我挑了 5 个验证过、效果稳定的 prompt,直接复制改参数就能用:

1. 公众号封面图(900×383)

Flat commercial illustration, a modern workspace with creative elements floating around, white and bright blue color scheme, 16:9 wide composition, minimal style with bold geometric shapes, clean background, no text, vector graphic feel

2. CSDN 技术博客封面

Minimalist tech illustration, abstract code elements and circuit patterns, navy blue and white color palette, clean geometric design, wide banner composition, modern developer aesthetic, no text, no words, flat vector style

3. PPT 配图(概念表达)

Clean flat illustration, conceptual visualization of data analysis, light blue and soft orange color scheme, centered composition with white space around the edges, suitable for presentation slide, simple shapes, professional look, no text

4. 产品主图(电商)

Product photography style, [你的产品] on a clean white pedestal, soft diffused lighting from front, subtle shadow beneath, pure white background, high-end commercial product shot, sharp focus, professional studio lighting, no text

5. 小红书配图(3:4)

Warm lifestyle aesthetic, [你的场景] in soft afternoon light, grainy film texture, cozy and inviting atmosphere, Korean-inspired minimal style, pastel tones, vertical 3:4 composition, shot on film camera, no text, no watermarks

一个实操流程:10 分钟出一张满意图

我现在的流程是这样的:

  1. 先构思(2 分钟):在脑子里想清楚画面应该是什么样
  2. 套模板(1 分钟):从上面 5 个公式里选一个,填参数
  3. 出初稿(30 秒):丢给 GPT-Image,等出图
  4. 看问题(30 秒):翻车了哪里?手指?文字?构图?
  5. 加避坑词(1 分钟):加上对应的否定词,调整描述
  6. 出终稿(30 秒):第二次基本就稳了
  7. 微调(如果还不满意,再改一轮,一般不超过 3 轮)

总耗时:5-15 分钟。

比以前自己做图快多了。以前用 Figma 或者 Canva 做封面,一张图至少 30 分钟。

写在最后

prompt 这件事,说到底就是两个字:具体

把"好看"变成"浅蓝色背景、柔光、干净构图",把"温馨"变成"暖黄色灯光、木质元素、毛绒质感"。

AI 不是你肚子里的蛔虫,你得把视觉语言讲清楚了它才听得懂。

上面这 5 个公式和 5 个模板,建议收藏下来,下次画图之前翻出来照着填。用个十次八次,就变成肌肉记忆了。

有什么好用的 prompt 欢迎评论区交换。下一篇打算写「摸鱼时间用 AI 画头像,闲鱼上月赚 2000」,感兴趣的关注一下。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/21 8:29:31

百度网盘直链解析终极指南:如何免费实现高速下载的完整教程

百度网盘直链解析终极指南:如何免费实现高速下载的完整教程 【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址 项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 你是否厌倦了百度网盘几十KB/s的蜗牛速度?今…

作者头像 李华
网站建设 2026/6/21 8:25:51

接口自动化测试实战:从Pytest框架搭建到CI/CD集成

1. 项目概述:为什么接口自动化测试是研发效能的核心引擎?干了这么多年测试和开发,我越来越觉得,接口自动化测试这玩意儿,早就不是测试工程师的专属技能了。它更像是一个团队的“基础设施”,是保障软件质量、…

作者头像 李华
网站建设 2026/6/21 8:24:10

图神经网络结构编码新范式:双随机矩阵原理与实战

1. 从拉普拉斯算子到双随机矩阵:图结构编码的范式演进如果你最近在折腾图神经网络,尤其是想提升模型对图结构信息的捕捉能力,那么“拉普拉斯算子”这个词你一定不陌生。它几乎是所有图卷积操作的基石,从经典的GCN到后来的GAT&…

作者头像 李华
网站建设 2026/6/21 8:09:19

GPT-4o与Claude Sonnet 4.6任务分工实战指南

1. 这不是“选哪个更好”,而是“用哪个干哪件事”——GPT-4o 与 Claude Sonnet 4.6 的真实分工逻辑你刷到这个标题时,大概率正卡在某个具体任务里:可能是刚写完一段 Python 脚本,但函数命名总不够精准;可能是要快速把一…

作者头像 李华
网站建设 2026/6/21 8:08:20

3分钟掌握biliTickerBuy:告别B站会员购抢票焦虑的智能解决方案

3分钟掌握biliTickerBuy:告别B站会员购抢票焦虑的智能解决方案 【免费下载链接】biliTickerBuy b站会员购购票辅助工具 项目地址: https://gitcode.com/GitHub_Trending/bi/biliTickerBuy 你是否曾在B站会员购抢票时,眼睁睁看着心仪的商品在点击瞬…

作者头像 李华
网站建设 2026/6/21 8:01:02

零代码AI编程实战:用通义灵码、Qoder与Junie生成AQI查询工具

1. 这不是写代码,是“指挥AI工程师”——零代码AI编程的真实起点“零代码AI编程”这个词刚冒出来时,我盯着它看了三分钟。不是因为兴奋,而是怀疑:真能不写一行print("Hello"),就让AI把一个带UI、有逻辑、能跑…

作者头像 李华