【提示词创作第四十六节】精准掌控画面人物比例
人物比例总失调?真的只是提示词的问题吗?
内容预览
教程内容
导语:人物比例总失调?真的只是提示词的问题吗?
在AI视觉创作进入2026年的今天,我们惊喜地发现,像Midjourney v7和即梦AI的最新版本,在“文生图”领域对比例、常识的理解已近乎完美。
然而,绝大多数创作者在迈向进阶时,依然被同一个鬼魅般的“恐怖谷”问题困扰:
那就是“图生图”中的合成比例崩溃。
你想把一张高质量的人物模特照放入一张壮观的异星峡谷背景中,结果AI不是生成了一个“挂”在山顶的微缩人,就是把模特的头撑满了大厅。
这并非AI的随机失误,而是由于AI在处理“独立的图像资产”与“新的空间环境”时存在严重的语义断层。
本教程将利用目前最主流、最高效的即梦、Midjourney及Nano等工具的底层逻辑,教你如何用最直观的方法,彻底驯服图生图画面中的比例失调,把人物“种”进环境。
第一章:图生图合成的“认知障碍”:为什么AI读不懂你想“放”哪里?
在开始实操前,我们必须理解AI在进行图生图操作时的核心短板。
1.1 环境优先级逻辑 VS. 元素定位
2026年的文生图模型,其注意力机制能够完美平衡“人物本身”与“场景空间”。然而,当你使用图生图功能时,你是在试图把两个独立的、拥有自己独立视觉上下文的图像强制融合。
场景模拟:你提供了一张浩瀚无垠、充满巨型异星植物和废墟的广阔峡谷场景图作为背景(环境资产)。你又提供了一张普通的、站立姿态的探险家模特图(人物资产)。
环境的提示词:
A vast and boundless canyon filled with giant alien plants and ruins,Realistic style,uE5 game rendering(翻译:一个广阔无边的峡谷充满了巨大的外星植物和废墟,逼真的风格,uE5游戏渲染)
人物的提示词:
4-panel character reference sheet on pure white background: left panel is a close-up headshot portrait, right 3 panels are full-body views (front view, side view, back view) on clean white background. A rugged alien explor