话说回来,我玩AI绘图也有一段时间了,一开始真是一头雾水,折腾得我快吐了。你们是不是也遇到过那种情况?喂给模型一堆文字,它吐出来的图,要么是看着假得要命的塑料人,要么就是各种细节崩坏,跟我的预期完全是两回事。
我当时就觉得,是不是模型不听我的话?我看网上说,这个叫CFG(Classifier Free Guidance)的东西,就是控制模型听不听话的。这个数值越高,模型就越听你的话,出图就应该越精准。那我想,肯定要让它听话,所以我刚开始想都没想,就把CFG往天上怼!

- 刚开始,我设了个12。我以为这样能把光影和细节都扣得死死的,结果图是出来了,但是画面里各种鬼影,手脚畸形,光影也怪得很,颜色饱和度高到辣眼睛。
- 我不信邪,心想是不是还不够高,我继续硬着头皮怼到15。那简直没法看,整个画面都像是糊了一层油,噪点和伪影到处都是,完全是废图。
- 甚至有一次我手滑设到了30,机器跑了半天,直接给我报错了,或者就是出一张纯色背景的废图。我当时觉得这AI就是个骗子,根本不按套路出牌。
折腾了几天,我把显卡跑得发烫,终于意识到,高参数不代表高质量。我以前是瞎折腾,浪费了不知道多少电费和显卡时间。我开始怀疑,是不是我的理解错了?
从瞎调到科学跑图:我的数据记录过程
从那天起,我下定决心,不能再凭感觉瞎猜了。我决定老老实实地做记录,把跑图当成实验室工作来搞。我弄了个巨大的Excel表格,里面至少有上千条记录,专门用来记录参数和结果评分。

我把同样的Prompt、同样的种子、同样的模型固定住。我开始从CFG=4开始,一步一步往上调,每次只调0.5,一直调到10。然后我把出图结果截图,按照“画面自然度”、“细节保真度”、“光影真实性”这三个维度,给自己打分。这种方法虽然笨,但是它能让你看到参数变化带来的细微差别。
我发现了一个特别有意思的现象:CFG在低数值区间(4-7)的时候,每调整0.5,画面的变化是巨大的;可是一旦超过了8,后面调整带来的变化,反而没那么明显了,但副作用却越来越大。

我砸进去几十个小时试出来的黄金配置
折腾了快一个星期,终于让我摸出了几个让我舒服的数值。这个东西,真的没有固定的答案,但是大部分场景下,这个设置能让你少走弯路。你们直接拿去用,能省不少事。
- CFG = 6 到 8.5: 这是我目前觉得最万能的区间。低于6,模型太自由了,很多细节它就给你忽略了,图是艺术了,但不是我想要的。高于8.5,画面就开始显得“用力过猛”,细节锐化过度,有点假。
- 我的最爱:CFG=7。 我敢说,90%的写实风格图,你用7,配合DPM++ 2M Karras这个采样器,出图效果立马就稳了。它能保证你描述的元素都在画面里,同时又留了一点点空间让光影和纹理自然地融合。
- 特殊场景:CFG=5。 如果我跑的是一些抽象概念或者油画风格的东西,我就会降到5,让模型有点“跑偏”的空间,反而能出一些惊喜。
但这还不算完,很多人只看CFG,忽略了另一个超级重要的东西——采样步数(Steps)和采样器(Sampler)。CFG就像是模型的“执行力”,而Steps和Sampler就是它“执行的方式”。它们俩是互相制约的。
我发现,当你把CFG设得比较低(比如6或7),你可以稍微把步数拉高一点(比如35-40步),图的细节会更扎实,不会显得毛躁。反过来,如果你非要用高CFG(比如10),那你必须把步数压下来,比如只跑20步,再高下去那噪点和伪影能把你看哭。
我的心得就是:不要贪高。CFG太高,模型太想讨好你,反而把自己搞崩溃了。只有在恰到好处的数值下,模型才能发挥它真正的实力。
我为了找这几个参数,前前后后砸进去了一台3060的算力时间。我把每次运行的参数、结果图,都存在一个巨大的Excel表里。每次跑完图,我都会立刻给自己打个分:这张图的脸有没有崩?光影是不是自然?有没有出现多余的手指?
这种方法虽然笨,但是它让我彻底理解了每个参数之间的制约关系。我甚至发现了,在某些特定的LoRA权重下,CFG设到9反而能把金属的质感做得更出色。这些都是你看教程学不到,只有自己动手实践,把数据堆起来才能得出的
别光看别人的作业,自己跑起来,记下来,对比起来。等你真的把这几个关键参数玩明白了,你也就不是那个只会抄作业的新手了。真正的高手,都是拿数据喂出来的。
