Seedance 2.0 提示词攻略:掌握这套公式,10 分钟出电影感视频
Seedance 2.0 提示词攻略:掌握这套公式,10 分钟出电影感视频上周,一个做短视频的朋友找我吐槽:"Seedance 2.0 不是很火吗?我写了一大段提示词,还加了负面提示词,结果生成的人脸像被微波炉转过似的。"…

Seedance 2.0 提示词攻略:掌握这套公式,10 分钟出电影感视频
上周,一个做短视频的朋友找我吐槽:"Seedance 2.0 不是很火吗?我写了一大段提示词,还加了负面提示词,结果生成的人脸像被微波炉转过似的。"
我看了一眼他的提示词——Negative Prompt 写了三行,动作描述是"快速跳跃旋转",形容词堆了一排"震撼的、壮观的、极致的"。
问题不在工具。在他把用 Midjourney 和 Stable Diffusion 的老经验原封不动搬过来了。后来我帮他用本文的公式重写了提示词,同一个场景,生成质量判若两人。
Seedance 2.0 是字节跳动即梦平台()2026 年 2 月上线的视频生成模型,脾气跟以前那些 AI 工具不太一样。这篇文章不是产品说明书,而是一份「纠偏手册 + 实操指南」——先帮你卸掉旧习惯,再装上正确姿势。
读完你能拿走的东西:一套可复制的提示词公式、10 个直接能用的场景模板(含 4 个社交媒体热门探索场景)、一份生成参数设置指南、一张效果不好时的排查表、一份写提示词时逐条对照的 Checklist,以及最关键的——搞懂 Seedance 2.0 跟其他工具到底哪里不一样。
快速导航(点击跳转):
- • 30 秒看懂 Seedance 2.0 + 平台入口
- • 5 条反常识(负面提示词 · 动作越慢越好 · 别写"好看" · 一个视频一件事 · @引用杀手锏)
- • 提示词公式 8 维度(含场景词库 · 光影速查表 · 运镜对比 · 提示词长度 · 中英文选择)
- • 从 SD/MJ 迁移速查卡
- • 音画一体
- • 生成参数设置
- • 10 个场景模板(含图生/文生选择 · 美食特写 · 热门探索场景)
- • 踩坑 & 排查表
- • 工具对比 & 已知局限
- • 批量出片工作流
- • Checklist & 练习
谁适合读这篇?怎么读最省时间
这篇更像是你团队里的「Seedance 出片操作手册」,不同读者可以这样用它:
- • 【小白创作者】刚开始玩 AI 视频
- • 只看:「5 分钟超懒人 SOP」→ 「反常识 1–3」→ 挑 2 个模板照抄。
- • 目标:先稳定出 2–3 条「不翻车」的视频,再考虑花活。
- • 【从 MJ / SD 迁移过来的老玩家】
- • 只看:「迁移速查卡」→ 「8 维度公式」→ 「@引用杀手锏」。
- • 目标:把原来那一套英文关键词 + 参数调优心智,换成 Seedance 的「素材 + 中文句子」心智。
- • 【内容团队 / 工作室】要批量出片
- • 只看:「批量出片工作流」→ 「10 个场景模板」→ 「Checklist & 排查表」。
- • 目标:做一套你们自己的团队 SOP,让新人照着就能出片。
建议收藏:第一次可以从头到尾读一遍,之后把「迁移速查卡 / 模板索引 / Checklist」当成工具随时翻。
5 分钟超懒人 SOP(适合第一次体验)
如果你只想先搞出一条像样的视频,先照着这一段一步步来,不要改流程。
- 1. 打开即梦平台
jimeng.jianying.com→ 登录 → 左侧点「AI 视频」。 - 2. 顶部模型切到 Seedance 2.0。
- 3. 生成模式选 「文生视频」。
- 4. 右侧参数这样选:
- • 时长:5 秒
- • 分辨率:1080p
- • 画面比例:9:16(适合刷短视频)
一位穿白色亚麻连衣裙的年轻女生,长发微卷自然垂落,站在【春日午后】的【日式庭院木廊】上,樱花花瓣缓缓飘落在肩头和发间。近景,缓慢推镜,暖光从侧面洒入,柔光散射,日系清新暖色调,画面稳定无抖动,4K超高清,面部清晰不变形,五官自然,细节丰富,电影质感。- 6. 点「生成」,等进度条跑完。
- 7. 做一件事:对照后文的「8 维度公式」,看看这条提示词里,你以前完全没写过的是哪几个维度。
想系统学的话,预留 20 分钟,从头到尾读完,并把后面的 3 道练习题都亲手改一遍,一周内就能形成提示词肌肉记忆。
30 秒看懂 Seedance 2.0:三个词概括它的定位

拆操作之前,先看数据(2026 年 2 月):
| 维度 | Seedance 2.0 | Kling 3.0 | Sora 2 | Veo 3.1 |
|---|---|---|---|---|
| 开发商 | 字节跳动 | 快手 | OpenAI | |
| 最高分辨率 | 2K(2048×1080) | 1080p | 1080p | 1080p |
| 最长时长 | 15 秒 | 10 秒 | 12-25 秒 | 8 秒 |
| 图片输入 | 最多 9 张 | 1-2 张 | 1 张 | 1 张 |
| 视频输入 | 最多 3 个 | ❌ | ❌ | ❌ |
| 音频输入 | 最多 3 个 | ❌ | ❌ | ❌ |
| 原生音频 | ✅ | ✅ | ✅ | ✅ |
| 核心优势 | 可控性 + 多模态 | 运动质感 | 物理模拟 | 光影渲染 |
数据截至 2026 年 2 月,各产品可能随版本更新变化。
三个词概括 Seedance 2.0:多模态输入(图片+视频+音频+文本四种素材任意组合)、2K 分辨率(截至目前行业最高)、音画一体(画面和声音一次出来)。
Sora 赢在物理模拟精准,Kling 赢在运动质感和皮肤渲染,Seedance 2.0 赢在可控性——你不用写一段话"许愿"让 AI 猜,而是丢一组参考素材进去,告诉它"照这个来"。
怎么做到的?靠 @引用系统和提示词公式。不过在讲"正确姿势"之前,先说说大多数人一上手就踩的坑。
1 分钟找到入口
第一次用的话,按这个路径走:
- 1. 打开即梦平台:(需登录字节跳动/抖音账号)
- 2. 左侧菜单找到 「AI 视频」 入口
- 3. 顶部切换模型为 「Seedance 2.0」(默认可能是 1.5 Pro,记得手动切换)
- 4. 选择生成模式:
- • 「文生视频」:只写提示词,不传素材——适合第一次体验
- • 「全能参考」:上传图片/视频/音频 + 写提示词——适合需要 @引用的场景
- • 「首尾帧」:只上传 1 张首帧图——适合简单的图生视频
💡 新手推荐路径:选「文生视频」→ 模型选 Seedance 2.0 → 复制本文任意模板 → 时长 5 秒 → 分辨率 1080p → 点生成。30 秒搞定第一次体验。

反常识 #1:负面提示词?别写了

用过 Stable Diffusion 的人,基本都养成了写 Negative Prompt 的肌肉记忆——"no blur, no distortion, no extra fingers"。
Seedance 2.0 对这套完全无感。
模型不会读负面提示词。你写了,它当没看见。更亏的是,你把精力花在列"不要什么"的清单上,真正该写的正向描述反而不够具体,效果自然差。
做法很简单,把"不要"翻转成"要":
| 你的老习惯 | Seedance 的正确写法 |
|---|---|
| Negative: 不要模糊 | 画面锐度清晰、细节丰富 |
| Negative: 不要变形 | 面部稳定不变形、五官清晰、人体结构正常 |
| Negative: 不要抖动 | 画面稳定、无抖动、丝滑流畅 |
| Negative: 不要多余手指 | 人体比例自然、结构正常 |
说白了,Seedance 2.0 的规矩就一条:只告诉它你要什么,别告诉它你不要什么。翻转完之后,这些正向描述就变成了后面公式里的"约束词"——先记住翻转思路,具体怎么写后面维度 8 会详细讲。
试一下——同一个"人物转身"场景,错误写法 vs 正确写法:
❌ 错误(带负面提示词):
一位女生在花园里转身。Negative Prompt: no blur, no distortion, no extra fingers, no deformation, 不要模糊,不要变形✅ 正确(全部翻转为正向描述):
一位穿白色棉麻衬衫的年轻女生,站在开满玫瑰的花园里,缓慢转身面向镜头,表情自然微笑,阳光从侧面洒下柔和光影。近景,固定镜头,画面锐度清晰,细节丰富,面部稳定不变形,五官清晰,人体结构正常,比例自然,画面稳定,无抖动,4K高清,电影质感。把右边这条直接复制到 Seedance 2.0 试试,感受一下"全正向描述"的效果。
来源:Seedance AI 官方提示词指南(seedance-ai.site)
反常识 #2:动作越慢,视频越好

这条最违反直觉。
你想做个"酷炫"视频,本能地写"人物在街上飞速奔跑,跳过障碍物,翻转落地"。结果——人体变形严重,肢体比例完全失控。
原因不复杂:AI 视频模型本质上是在帧与帧之间做插值预测。动作越快、幅度越大,两帧之间的差异就越大,模型"猜错"的概率就越高。
记住三个字:慢、连、稳。
| 动作类型 | ❌ 翻车写法 | ✅ 稳定写法 |
|---|---|---|
| 人物移动 | 快速跳跃、剧烈跑动 | 缓慢转身、轻轻抬手、微微低头 |
| 表情变化 | 大笑、夸张尖叫 | 嘴角微微上扬、眼神慢慢看向镜头 |
| 环境动态 | 狂风暴雨、爆炸 | 微风轻拂头发、树叶缓缓飘落 |
| 镜头动作 | 快速甩镜、急推 | 镜头缓缓推进、轻微环绕、平稳跟拍 |
有个简单的判断方法:你拿手机用慢镜头能拍出来的动作,Seedance 基本都能做好;需要高帧率运动相机抓拍的那种——大概率翻车。
推荐词库:缓慢、轻柔、连贯、自然、流畅、不僵硬。
试一下——同一个"女生走路"场景,快动作 vs 慢动作:
❌ 错误(快+大幅度):
一个女生在街上飞快奔跑,跳过台阶,头发大幅甩动,裙摆剧烈飘动,快速转弯冲向镜头✅ 正确(慢+连贯+小幅度):
一位穿米色风衣的年轻女生,在秋日的银杏大道上缓慢行走,脚步轻盈,微风轻拂发丝,落叶缓缓飘落在肩头,女生微微侧头看向远方,表情宁静自然。中景,镜头缓慢跟拍,画面丝滑流畅,无抖动,治愈清新风格,暖色调,4K高清,面部稳定不变形,人体结构正常,细节丰富。复制右边这条到 Seedance 2.0,注意看人物行走时身体是否自然连贯——这就是"慢"带来的稳定性。
反常识 #3:别写"好看"——给画面,别给形容词

"一个很美的场景,画面很好看。"
这句话 Seedance 听到等于什么都没听到。"美""好看"是人类的主观评价,没有视觉锚点,模型不知道你脑子里想的是日式庭院还是赛博朋克。
原则:每个形容词都必须能被画出来。
| ❌ 空洞描述 | ✅ 具体描述 |
|---|---|
| 很美的女生 | 穿白色亚麻连衣裙的年轻女生,长发微卷 |
| 好看的风景 | 春日午后的日式庭院,樱花花瓣缓缓飘落 |
| 酷炫的画面 | 夜晚城市天际线,霓虹灯光倒映在湿润地面 |
| 画面很丰富 | 前景樱花枝条、中景人物、背景远山,三层构图 |
| 高级感 | 暗调、极简构图、冷色调打光、哑光质感 |
风格描述也一样。别写"唯美",写"治愈清新、日系暖色调、柔光散射"。别写"高级",写"赛博朋克、暗调、极简干净"。
你会发现,提示词写得具体之后,连生成时间都会缩短——因为模型不需要"瞎猜"了。
试一下——同一个"好看的场景":
❌ 错误(空洞形容词):
一个非常唯美的画面,一个漂亮的女生在很好看的风景里,画面很美,氛围感很强✅ 正确(每个词都有画面):
一位穿白色亚麻连衣裙的年轻女生,长发微卷自然垂落,站在春日午后的日式庭院木廊上,樱花花瓣缓缓飘落在肩头和发间。近景,缓慢推镜,暖光从侧面洒入,柔光散射,日系清新暖色调,画面稳定无抖动,4K超高清,面部清晰不变形,五官自然,细节丰富,电影质感。对比两条提示词的区别:右边每个描述都能"画"出来——白色亚麻裙、日式庭院、侧面暖光。试试生成效果。
反常识 #4:一个视频只讲一件事

"三个人在公园里野餐,一个人在弹吉他,一个在拍照,还有一只狗在旁边跑来跑去,天空有飞机飞过。"
4 个主体,5 个动作。你脑子里有画面,Seedance 脑子里是混乱——它试图同时渲染所有东西,结果每个都做不好。
一个视频 = 一个主体 + 一个核心动作。 这是铁律。
❌ 三个人在公园里野餐,一个弹吉他,一个拍照,一只狗跑来跑去
✅ 一位年轻女生在公园草地上弹吉他,微微低头看琴弦,阳光洒在侧脸上需要多人多动作?拆成多个视频分别生成,用剪映拼接。Seedance 2.0 单次生成 4-15 秒,拆分+拼接才是正经的工作流。
试一下——把上面的"公园弹吉他"正确版直接拿去生成:
一位穿格子衬衫的年轻女生,坐在午后公园的草坪上弹吉他,微微低头看琴弦,手指轻轻拨弦,阳光从侧面洒在脸上形成柔和光影,背景是虚化的绿色草地。中景,固定镜头,画面稳定无抖动,治愈清新风格,4K高清,面部清晰不变形,人体结构正常,动作自然流畅,不僵硬,细节丰富。一个主体(女生)+ 一个核心动作(低头拨弦)+ 一个简单场景(草坪)。生成后感受一下"聚焦"带来的画面质量。
反常识 #5:别光写文字——@引用才是杀手锏

大多数人打开 Seedance 2.0,跟用 ChatGPT 一样——在框里写一段话,点生成。
这只用到了它 30% 的能力。
Seedance 2.0 最大的升级叫多模态输入:你可以把图片、视频、音频一起丢进去,然后用 @ 符号告诉模型,每个素材分别干什么。
具体操作
- 1. 选「全能参考」入口(别选「首尾帧」入口,那个只支持单张图片)
- 2. 拖拽上传素材:图片最多 9 张、视频最多 3 个(总时长 ≤15 秒)、音频最多 3 个(总时长 ≤15 秒),混合总上限 12 个文件
- 3. 在提示词里用 @ 分配任务:
@图片1 作为首帧人物形象
@图片2 参考场景背景
@视频1 参考镜头运动方式
@音频1 用于背景配乐
人物缓慢转身微笑,微风吹动头发,镜头平稳跟随,画面稳定,4K高清,面部不变形在输入框直接打 @ 就能唤起引用面板,也可以点工具栏的 @ 按钮。操作成功后,输入框里会出现带颜色的标签,标签上显示素材文件名——看到这个就说明引用已绑定。

各素材怎么用
| 素材类型 | 干什么用 | 写法示例 |
|---|---|---|
| 图片 | 锁定人物五官/服装/场景 | @图片1 作为首帧,保持人物样貌 |
| 视频 | 复刻运镜/动作/转场 | @视频1 参考镜头语言和运镜 |
| 音频 | 定调节奏/配乐参考 | @音频1 用于配乐 |
| 多图 | 角色+场景分别指定 | @图片1 人物形象 @图片2 场景风格 |
三个容易踩的坑
坑一:@引用对错号。 上传了 3 张图,想用第 2 张当首帧,@图片1 却指向了第 1 张。写完之后鼠标悬停确认一下,3 秒钟能省 3 分钟等待。
坑二:拿图片当视频引用。 上传的是静态图片,提示词却写"参考 @图片1 的运镜"——静态图片哪来的运镜?没意义。
坑三:混淆"参考"和"编辑"。 这两个用途完全不同:
- • "参考 @视频1 的运镜" = 学这个运镜方式,内容重新生成
- • "将 @视频1 中的女生换成花旦" = 在这个视频上改
@引用系统是 Seedance 2.0 的独家能力。截至目前,Sora、Kling、Veo 都没有同等级别的多模态组合输入。
试一下——完整的多模态 @引用提示词(上传 2 张图片 + 1 个视频后使用):
@图片1 作为首帧,保持人物的面部特征和服装不变
@图片2 参考场景的色调和氛围
@视频1 参考镜头的运动方式和节奏
人物站在画面中央,缓慢抬起右手拢了一下耳边的头发,微微侧头,嘴角自然上扬,目光缓缓看向镜头右侧。近景,画面稳定无抖动,丝滑流畅,暖色调,4K高清,面部稳定不变形,五官清晰,同一角色,服装一致,发型不变。准备好你的参考素材(人物照片 + 场景照片 + 运镜参考视频),用「全能参考」入口上传后粘贴这条试试。
从 SD/MJ 迁移到 Seedance 2.0:速查卡
如果你之前用 Stable Diffusion 或 Midjourney,这张表是前面 5 条反常识的浓缩版,加上 SD/MJ 用户特有的 4 条习惯差异(权重语法、参数调优、ControlNet、LoRA),帮你一张表完成认知切换:
| 你的旧习惯(SD / MJ) | Seedance 2.0 正确做法 | 原因 |
|---|---|---|
| 写 Negative Prompt 三行起步 | 删掉全部负面提示词 | 模型不读,写了浪费字数 |
| 英文提示词效果更好 | 直接写中文 | 字节训练的模型,中文理解力原生级别 |
| 关键词用逗号隔开:girl, garden, smile, 4K | 写完整句子描述连贯场景 | Seedance 理解语句逻辑,不是关键词匹配 |
| 堆叠权重语法:(masterpiece:1.5) | 不支持权重语法,写自然语言 | 没有这个机制,写了会被当成普通文字 |
| CFG Scale / Steps / Sampler 等参数调优 | 只有时长、分辨率、比例三个参数 | 底层架构不同,无需也无法微调采样参数 |
| ControlNet / IP-Adapter 精确控制 | @引用系统 + 多模态素材 | 用图片/视频/音频素材替代插件控制 |
| Seed 值锁定复现结果 | 暂无 seed 机制,靠详细提示词降低随机性 | 提示词越精确,结果一致性越高 |
| LoRA 模型切换风格 | 在提示词里写风格词 + @引用风格参考图 | 不支持自定义模型,用参考图替代 |
| 只写画面描述 | 加运镜 + 约束词 | 这是视频不是图片,镜头语言和稳定约束必写 |
一句话总结迁移心法:从"参数调优"转向"素材+语言描述",从"关键词拼接"转向"写句子讲故事"。
提示词核心公式——8 个维度拆解
聊完反常识,进入最核心的部分。在我的使用经验中,提示词是影响出片质量最关键的变量。
万能公式:
主体 + 动作 + 场景 + 光影 + 镜头语言 + 风格 + 画质 + 约束8 个维度不用每次写全,但有 4 个是必写项:动作、镜头、画质、约束。其余按需组合。
先回答两个"元问题"
在拆维度之前,先解决两个大家最常问的问题:
提示词写多长合适?
我的经验:80-200 字是甜区。
- • 低于 50 字:信息量不够,模型靠猜,结果随机性大。"一个女孩在海边"只有 7 个字,模型要自己决定长相、服装、动作、光影、镜头——每个变量都是赌骰子。
- • 80-200 字:刚好覆盖公式的核心维度,模型有足够信息,又不会被噪音干扰。本文所有模板都在这个区间。
- • 超过 300 字:信息过载,后面的描述权重会被稀释。模型不是"写越多越听话",而是"越精准越听话"。实测超长提示词反而容易丢掉后半段的描述。
简单记:一条提示词 = 一条微博的长度,差不多就对了。
中文写还是英文写?
直接写中文。Seedance 2.0 是字节跳动训练的模型,对中文的理解力是原生级别的。实测下来:
- • 纯中文:效果最稳,尤其是国风、日系、写实等场景,中文描述比英文更精准
- • 纯英文:也能用,但不会比中文更好,没有必要专门翻译
- • 中英混写:部分专业术语可以混用(如"bokeh""tilt-shift""cinematic"),但主体描述建议用中文
跟 Midjourney、Stable Diffusion 不同——那些模型训练数据以英文为主,所以英文提示词效果更好。Seedance 2.0 不存在这个问题。别再把中文提示词翻译成英文了,浪费时间。
维度 1:主体
写清楚"谁"或"什么"。具体到能在脑子里画出来。
✅ 一位穿淡蓝色连衣裙的年轻女生,长发微卷,戴着细框眼镜
✅ 一只橘色短毛猫,蹲在窗台上
❌ 一个女孩(太泛了,什么样的女孩?)
❌ 一个好看的人("好看"不是视觉信息)维度 2:动作(最重要)
前面讲过了——慢、连、稳。
推荐动词:缓慢转身、轻轻抬手、脚步轻移、微微低头、随风摆动。
多动作串联时,按时间顺序写清连接关系:
人物缓慢抬起右手,轻触额前头发,微微侧头,嘴角自然上扬,视线缓缓看向镜头维度 3:场景
交代背景和空间感。场景写得越具体,模型"瞎猜"的空间越小。
在林间小路上,两旁是高大的银杏树,地上铺满金色落叶
海边,日落时分,天空呈暖橙色渐变常用场景词库——按类型快速查找:
| 类型 | 场景关键词 |
|---|---|
| 室内·生活 | 咖啡馆靠窗座位、卧室落地窗前、厨房大理石台面、书房木质书架旁 |
| 室内·商业 | 极简白色摄影棚、暗调展厅聚光灯下、办公室落地玻璃窗前 |
| 户外·自然 | 银杏大道、樱花树下、海边礁石、山间竹林、湖边木栈道、薰衣草花田 |
| 户外·城市 | 霓虹灯街道、雨后柏油路面、天台远眺城市天际线、老城区石板巷 |
| 虚构·奇幻 | 浮空岛屿、水晶宫殿、蒸汽朋克工厂、外太空空间站、水下废墟城市 |
场景描述的技巧:写一个具体空间 + 1-2 个环境细节。"花园"太泛,"开满绣球花的日式庭院,石板小路上有落花"就够了。
维度 4:光影
光影是决定氛围和色温的关键维度——同一个场景,换一种光,情绪完全不同。
暖光透过窗户洒在脸上
侧逆光勾勒出轮廓线
阳光透过花瓣投下斑驳光影场景 × 光影速查表——直接查你的场景适合什么光:
| 氛围目标 | 光影关键词 | 典型场景 |
|---|---|---|
| 温暖治愈 | 暖黄阳光、柔光散射、侧面暖光洒在面部 | 日系人像、咖啡馆、午后花园 |
| 唯美梦幻 | 逆光轮廓光、光晕(lens flare)、金色光斑 | 日落人像、花田、海边 |
| 高级冷调 | 冷色自然光、侧面硬光、阴影明显 | 商业大片、城市夜景、室内极简 |
| 戏剧张力 | 侧逆光、伦勃朗光(三角光)、明暗对比强烈 | 武侠、悬疑、电影感人像 |
| 纪实真实 | 自然光线、无人工打光、环境光 | 纪录片、街拍、Vlog |
| 夜景氛围 | 霓虹灯光映在脸上、冷蓝紫色调、湿润地面反光 | 赛博朋克、城市夜景、雨夜 |
| 恐怖悬疑 | 底部打光、单侧硬光、大面积暗部、惨白冷色 | 悬疑短片、恐怖氛围 |
技巧:光影词和风格词要配套。写了"赛博朋克"风格,就配"霓虹灯光""冷蓝紫色调";写了"治愈清新",就配"暖黄阳光""柔光散射"。光影和风格打架是最常见的翻车原因之一(详见踩坑章节)。
维度 5:镜头语言(Seedance 的强项)
分两块——景别和运镜。
景别选择:
| 景别 | 什么时候用 |
|---|---|
| 特写 | 拍面部细节、情绪、产品特写 |
| 近景 | 拍表情、上半身、对话场景 |
| 中景 | 日常叙事、动作展示 |
| 全景 | 展示环境、人物全貌 |
运镜方式:
| 运镜 | 效果 | 典型场景 |
|---|---|---|
| 缓慢推镜 | 由远及近,代入感 | 开场引入、情绪递进 |
| 轻微拉远 | 由近及远,全貌 | 结尾、揭示环境 |
| 平稳横移 | 横向平移,空间感 | 展示场景宽度 |
| 环绕半圈 | 绕主体旋转,立体 | 人物展示、产品环绕 |
| 固定镜头 | 不动,稳定叙事 | 对话、静态情绪 |
| 手持稳定 | 微微晃但不抖 | 纪实感、Vlog |
运镜修饰词(每次都加):无抖动、丝滑流畅、画面稳定。
Seedance 2.0 对运镜描述的理解力很强,中文直接写就行。你写"希区柯克变焦"它也认识——当然,平时用"缓慢推镜""环绕半圈"这些够用了。
运镜的威力有多大? 看同一个场景换运镜的效果——
同样是"一位年轻女生站在雨后的城市街头,轻轻抬头看向天空":
【缓慢推镜版】…中景,镜头从街道远处缓慢推近到女生面部特写…
→ 效果:代入感强,观众"走向"主角,适合情绪递进、开场引入
【环绕半圈版】…中景,镜头从女生正面缓慢环绕到侧面…
→ 效果:立体感强,人物像雕塑一样被"展示",适合人物展示、造型展示
【固定镜头版】…中景,固定机位,画面静止只有人物微微动…
→ 效果:沉静、克制,适合安静情绪、对话场景、文艺风三条提示词只有运镜不同——但画面叙事感完全不同。推镜 = 代入,环绕 = 展示,固定 = 沉静。选运镜之前先想:这条视频想让观众感受什么?
维度 6:风格
风格词是提示词里"性价比"最高的维度——换一组风格词,同样的主体+动作出来的画面完全不同。
| 风格 | 关键词 | 典型场景 |
|---|---|---|
| 治愈清新 | 治愈清新、唯美文艺、日系清新、柔光散射 | Vlog、情感短视频 |
| 韩系氛围 | 韩系氛围感、梦幻柔光、复古胶片、颗粒质感 | 人像写真、街拍 |
| 暗调高级 | 赛博朋克、暗调高级、极简干净、霓虹光影 | 科技感、城市夜景 |
| 写实纪录 | 真实摄影、纪实风格、自然光线、手持微晃 | 纪录片、新闻感 |
| 复古胶片 | 80 年代胶片质感、褪色暖调、颗粒感、暗角 | 怀旧回忆、老照片动态化 |
| 动漫二次元 | 日本动漫风格、赛璐珞上色、线条清晰、二次元 | 动漫混剪、虚拟角色 |
| 水墨国风 | 中国水墨画风格、淡墨渲染、留白构图、意境悠远 | 国风短视频、武侠 |
| 广告大片 | 商业广告质感、高反差、精致打光、杂志封面 | 产品宣传、品牌视频 |
| MV 风格 | 音乐视频质感、闪切剪辑、饱和色彩、节奏感强 | 音乐配合、舞蹈类 |
| 3D 渲染 | 3D 渲染风格、皮克斯动画质感、柔和材质、全局光照 | 动画短片、卡通角色 |
| 黑白电影 | 黑白画面、高对比度、经典好莱坞、光影戏剧性强 | 艺术短片、情绪表达 |
风格词的威力有多大? 看同一个场景换风格的效果——
同样是"一位年轻女生站在城市街头,微微侧头看向远方":
【治愈清新版】…日系清新暖色调,柔光散射,画面明亮温暖…
【赛博朋克版】…霓虹灯光映在脸上,暗调高级,冷蓝紫色调,雨后湿润地面反光…
【复古胶片版】…80 年代胶片质感,褪色暖调,画面带颗粒感和暗角,怀旧氛围…三条提示词除了风格和光影不同,主体、动作、镜头、约束完全一样——但生成出来是三个完全不同的世界。这就是为什么风格词值得多花 10 秒钟想清楚。
维度 7:画质(必写)
结尾选 4-6 个画质词,像加保险一样:
4K、超高清、细节丰富、锐度清晰、电影质感、色彩自然、光影柔和、无模糊、无重影、无闪烁、画面稳定不用全堆上,挑跟你场景最相关的几个就行。
维度 8:约束(必写,防变脸保命用)
文生视频必加:
面部稳定不变形,五官清晰,人体结构正常,比例自然,动作不僵硬图生视频再加一句:
同一角色,服装一致,发型不变,保持人物样貌与服装一致这组约束词不是"锦上添花",是"保命绳"。根据我的实测,不加约束直接生成时,大约一半以上的视频会出现不同程度的面部变形。加上约束词后,翻车率明显降低。
完整示例:8 个维度全上
下面这条提示词把公式的 8 个维度全部写齐了,可以直接复制使用:
【主体】一位穿深蓝色针织毛衣的年轻男生,短发干净利落,戴细框银色眼镜,
【动作】坐在咖啡馆靠窗座位,缓慢端起一杯拿铁,轻轻吹了一口热气,抿了一小口,然后抬眼看向窗外,
【场景】窗外是雨天的城市街道,玻璃上有细密雨滴,街道对面有暖色灯光的店铺,
【光影】室内暖黄吊灯照亮面部,窗外冷色自然光与室内暖光形成冷暖对比,
【镜头】近景,镜头从咖啡杯缓慢推近到人物面部,
【风格】韩系氛围感,复古胶片色调,梦幻柔光,
【画质】4K超高清,电影质感,色彩自然,光影柔和,细节丰富,画面稳定,
【约束】面部稳定不变形,五官清晰,人体结构正常,比例自然,动作自然流畅不僵硬。注意:实际使用时不需要加【维度名】标签,这里标出来是方便你学习对照。去掉标签直接连成一段就行。

音画一体:一个工具搞定,不用再开四个软件

Seedance 2.0 有一个容易被忽略但真的很实用的能力:原生音频生成。
以前做一条完整的短视频,流程是这样的:
- 1. 用 AI 工具生成画面
- 2. 打开另一个工具生成配音
- 3. 再找一个工具加背景音乐
- 4. 打开剪映把音画对齐
四个工具来回切换,光对齐时间轴就能搞半小时。
现在用 Seedance 2.0:写一段提示词,画面+环境音效+人声对白+背景音乐一次全出来。
它具体能做这几件事:
- • 环境音效:海浪声、风声、鸟叫,自动匹配画面内容
- • 人声对白:支持多语言唇形同步
- • 背景音乐:自动生成节奏匹配的配乐,据平台介绍无版权风险
我用前面"氛围风景"的海边日落模板试了一下,生成的视频自带了海浪拍岸的声音和一段节奏舒缓的钢琴配乐。音画匹配度大概打 80 分(如果 100 分是剪映手动精调的效果)——环境音很贴合,但背景音乐风格有时候不是你想要的。这时候可以通过 @引用 上传自己的音乐素材当参考,模型会学你音乐的风格和节奏来生成新配乐。注意:这里是"参考生成"不是"直接贴上去",想精确对齐还得回剪映。
音频怎么用提示词控制
很多人只写画面描述,音频完全交给模型随机生成。其实你可以用提示词主动控制音频效果:
| 你想要的音频效果 | 提示词写法 |
|---|---|
| 特定环境音效 | "伴随海浪拍岸声""远处传来鸟鸣""雨滴敲打玻璃的声音" |
| 特定配乐风格 | "背景是舒缓的钢琴旋律""轻快的吉他弹唱""紧张的弦乐渐强" |
| 音效 + 配乐同时要 | "自然环境音效搭配一段舒缓的钢琴作为背景音乐" |
| 静音/纯画面 | 不写任何音频描述(模型可能仍会加环境音,目前无法完全静音) |
| 精确控制配乐风格 | 上传参考音频,用 @音频1 参考配乐风格和节奏(比纯文字精准得多) |
关键区别:文字描述音频 = 模型自由发挥,@引用音频素材 = 模型学你给的参考。想要精确控制,优先用 @引用。
还有一个局限:如果你需要精确到帧的音乐卡点(比如卡鼓点做转场),原生音频做不到这个精度,老老实实用剪映手动对。
据 21 经济网报道,在理想条件下,Seedance 2.0 能在 60 秒内生成带原生音频的多镜头序列视频。一年前这种活要一个小团队干好几天。
试一下——一条带音频描述的完整提示词:
海边日落时分,金色阳光铺满海面,海浪轻轻拍打沙滩泛起白色泡沫,远处一只海鸥缓慢飞过画面上方。全景,镜头缓慢横移,暖橙色调,治愈清新风格,画面丝滑流畅。伴随海浪拍岸的自然音效和一段舒缓的钢琴旋律作为背景音乐,音画同步。4K超高清,无闪烁无重影,画面稳定。生成后注意听——视频应该自带海浪声和配乐。如果配乐风格不满意,可以上传你喜欢的音乐素材,用 @音频1 参考配乐风格和节奏 让模型学着来。别忽略生成参数:提示词只是一半
写好提示词点"生成"之前,还有几个参数要选。选错了,提示词写得再好也白搭。
时长怎么选
| 时长 | 适合场景 | 注意 |
|---|---|---|
| 4-5 秒 | 产品展示、单一动作、表情特写 | 最稳,翻车率最低,推荐新手从这里开始 |
| 6-8 秒 | 人物行走、简单叙事、氛围风景 | 性价比最高,大部分场景够用 |
| 10-15 秒 | 多段动作串联、长镜头、时间线分段 | 越长越容易出问题,后半段动作可能变形或偏移 |
新手建议:先用 5 秒出片,满意了再用"视频延长"接着生成。比一上来就选 15 秒靠谱得多——5 秒的试错成本低,15 秒生成一次要等更久,翻车了更心疼。
分辨率怎么选
| 分辨率 | 适合场景 | 生成速度 |
|---|---|---|
| 1080p | 日常内容、测试阶段、快速迭代 | 快 |
| 2K(2048×1080) | 最终出片、需要高画质的正式内容 | 慢(约 1.5-2 倍) |
实操建议:调试阶段用 1080p 快速试错,确认提示词效果后,最后一次再切 2K 出正式版。别每次都用 2K 调试,浪费时间和积分。
画面比例怎么选
| 比例 | 用途 |
|---|---|
| 16:9 | B 站、YouTube 横屏视频 |
| 9:16 | 抖音、小红书、Instagram Reels 竖屏 |
| 1:1 | 小红书封面、朋友圈视频 |
| 4:3 | 特殊构图需求 |
先想好发哪个平台,再选比例。别生成完了发现比例不对,裁剪会丢画面。
生成要等多久
别点了生成就盯着屏幕看——了解大致等待时间,可以同时准备下一条提示词:
| 配置 | 大致等待时间 |
|---|---|
| 5 秒 + 1080p | 1-2 分钟 |
| 5 秒 + 2K | 2-4 分钟 |
| 10-15 秒 + 1080p | 3-5 分钟 |
| 10-15 秒 + 2K | 5-8 分钟 |
以上为非高峰期的大致范围。高峰时段(晚间 20:00-23:00)可能需要排队,等待时间翻倍。如果超过 10 分钟没出结果,刷新页面检查是否卡住。
费用和免费额度
截至 2026 年 2 月,即梦平台的积分体系:
- • 新用户:注册即送免费积分(具体数量随平台活动变化,通常够生成 10-20 条视频)
- • 日常签到:每天签到可领少量积分
- • 积分消耗:分辨率越高、时长越长,消耗积分越多。2K + 15 秒是 1080p + 5 秒的数倍消耗
- • 付费充值:积分用完后可充值购买,具体价格见平台官网
省积分技巧:
- 1. 调试阶段用 1080p + 5 秒(消耗最低)
- 2. 确认提示词方向后再切 2K 出正式版
- 3. 有 1.5 Pro 选项的场景,调试用 1.5 Pro,出片用 2.0
⚠️ 平台积分政策可能随时调整,以即梦官网()实际显示为准。
10 个场景模板:复制粘贴,改几个词就能用
不想从零写提示词?直接用模板起步。但先回答一个问题——
文生视频还是图生视频?先看这张表
| 你的情况 | 选哪个 | 原因 |
|---|---|---|
| 脑子里有画面,但没有参考素材 | 文生视频 | 纯靠提示词描述,模型从零生成 |
| 有一张人物照片,想让 TA "动起来" | 图生视频 | 用照片当首帧,锁定人物形象 |
| 想复刻某个视频的运镜风格 | 图生/视频生视频 | @引用视频素材,模型学运镜 |
| 做数字人 / 个人 IP 内容 | 图生视频 | 必须用真人照片锁脸,否则每次生成的人都不一样 |
| 做风景、产品、抽象画面 | 文生视频 | 不涉及人脸一致性,文字描述够用 |
| 第一次用,纯体验 | 文生视频 | 门槛最低,不需要准备素材 |
一句话总结:涉及"人脸一致性"的场景,优先图生视频;不涉及人脸的,文生视频更方便。
模板 1:唯美人像

一位穿淡蓝色连衣裙的年轻女生,在林间小路缓慢行走,微风轻拂头发,自然微笑,暖色阳光透过树叶洒下斑驳光影。中景,缓慢推镜,画面流畅稳定,无抖动。治愈清新风格,4K高清,电影感,面部清晰不变形,人体结构正常,细节丰富。→ 适用:个人 Vlog、社交媒体短视频、情感类内容
怎么改:把"淡蓝色连衣裙"换成你要的服装,"林间小路"换成你的场景,其他保持不动。核心结构(动作+运镜+约束)不要改,这是保证质量的骨架。
模板 2:氛围风景

海边日落时分,金色阳光铺满海面,海浪轻轻拍打沙滩,远处几只海鸥缓慢飞过。全景,镜头缓慢横移,暖橙色调,治愈清新,画面丝滑流畅,4K超高清,无闪烁无重影,画面稳定。→ 适用:旅行视频、背景素材、放松类内容
模板 3:产品展示

一瓶精致的香水放在大理石台面上,镜头从瓶身特写缓慢拉远,展现瓶身反射的光泽和周围的花瓣装饰。环绕半圈运镜,极简干净风格,高级质感,柔和打光,4K超高清,细节锐利,画面稳定。→ 适用:电商产品视频、品牌宣传
模板 4:城市夜景

夜晚城市天际线,高楼灯光闪烁,车流在道路上形成光轨,镜头从高处缓慢推进。全景到中景过渡,赛博朋克氛围,暗调高级,霓虹色彩,4K超高清,画面稳定无抖动,电影质感。→ 适用:城市宣传片、科技感内容
模板 5:图生视频(人物动态)

基于参考图保持人物样貌与服装一致,人物缓慢抬起右手轻触额前头发,微微侧头,嘴角自然上扬,视线缓缓看向镜头。近景,固定镜头,自然流畅,不僵硬不变形,发型服装保持一致,高清细节,电影质感,4K,面部稳定。→ 适用:数字人、个人 IP 视频、社交媒体
首帧选图要点(图生视频的质量 80% 取决于这张图):
| 要求 | 推荐 | 避免 |
|---|---|---|
| 分辨率 | 1024×1024 以上,越清晰越好 | 低于 512px 的截图、缩略图 |
| 宽高比 | 跟输出视频比例一致(如 16:9 选横图) | 竖图做横屏视频(会被拉伸或裁切) |
| 人脸 | 正脸或 3/4 侧脸,五官清晰无遮挡 | 侧面 90°、墨镜遮脸、刘海挡眼 |
| 人脸占比 | 脸部占画面 15%-40% | 太小(<10%,丢细节)、太大(纯大头贴) |
| 光线 | 自然光或柔光,面部无硬阴影 | 强逆光(脸全黑)、闪光灯直射(面部过曝) |
| 背景 | 简洁干净,跟提示词场景不冲突 | 杂乱背景(模型可能保留背景元素干扰输出) |
| 来源 | 原始照片、高清素材站 | 社交媒体截图(压缩严重)、带水印图片 |
💡 不知道去哪找高质量参考图?往后翻到热门探索场景里的**"参考图去哪找?"**,有具体的免费素材站推荐和 AI 先出图再做视频的技巧。
模板 6:美食特写

一碗热气腾腾的日式拉面放在木桌上,浓郁的白色蒸汽缓缓升起,镜头从碗沿特写缓慢推近到汤面表面,可以看到金黄色的猪骨汤底、弹韧的面条、溏心蛋的流心截面和翠绿的葱花。特写到近景,环绕半圈运镜,暖色调,美食摄影质感,柔和打光,食材质感清晰,汤汁光泽诱人,4K超高清,细节锐利,画面稳定。→ 适用:美食探店、菜谱视频、餐饮品牌宣传
怎么改:把"日式拉面"换成你的菜品;核心技巧——美食视频的关键是材质感(光泽、蒸汽、流心、酥脆表面),而不是人物。多写食材的质感细节("芝士缓慢拉丝""巧克力表面光泽流动""刚出锅的油光"),少写动作。
![[13.mp4]]
热门探索场景:4 个社交媒体出圈模板
下面 4 个场景是目前推特、B 站、小红书、抖音上比较出圈的 AI 视频类型。它们的共同特点:题材天然带"快动作"属性,但通过慢动作重新诠释 + @引用参考图锁定风格,反而能出惊艳效果。
⚠️ 这四个模板都建议搭配参考图使用(通过「全能参考」入口上传)。纯文字也能生成,但加参考图后风格准确度会大幅提升。
参考图去哪找?
- • 免费素材站:Unsplash、Pexels、Pixabay(搜 "ink painting""hanfu""mecha concept art" 等关键词)
- • AI 先出图再做视频:用 Midjourney / DALL-E / 即梦的图片生成功能先生成一张静态概念图,再丢进 Seedance 当参考做视频
- • 自己的照片:做人像类内容时,手机自拍/他拍是最好的首帧素材——锁定你自己的脸
用图片做首帧(图生视频)时,图片质量直接决定输出质量。具体的分辨率、宽高比、人脸占比等技术要求,见前面模板 5 的首帧选图要点。
探索场景 1:水墨武林(中国风)

@图片1 参考水墨画风格和笔触质感
一位白发白须的老者,身穿灰色麻布长衫,在清晨山间竹林中缓慢舞剑,剑刃划过空气带出淡墨色残影,衣袂随动作轻轻飘动,薄雾在脚下缓缓流动。中景,镜头缓慢环绕半圈,中国水墨画风格,留白构图,淡墨渲染,黑白灰为主调,点缀淡青色,画面如泼墨流动,意境悠远。4K超高清,人物动作连贯自然不僵硬,面部稳定不变形,五官清晰,人体结构正常。→ 适用:国风短视频、武侠片头、传统文化内容
→ 参考图建议:上传一张水墨画作品,让模型学画风;纯文字生成时画风偏写实,加参考图才能出水墨意境
怎么改:把"竹林"换成"雪山之巅""古寺庭院";把"舞剑"换成"打太极""抚琴"。核心技巧——用"缓慢"重新定义武侠动作,避免快速打斗导致变形。
![[14.mp4]]
探索场景 2:古装美女节日舞(国风)

@图片1 作为人物形象参考,保持古装造型和妆容一致
一位身穿红色汉服的年轻女子,头戴金色步摇,在夜晚的灯笼长廊中缓慢起舞,长袖轻轻扬起划出优美弧线,裙摆随转身缓缓旋开,红色灯笼光映照在面庞上,花瓣缓缓飘落在肩头。近景到中景缓慢推镜,暖色调,中国传统节日氛围,柔光散射,画面丝滑流畅,无抖动,4K高清,电影质感,面部稳定不变形,五官清晰,人体结构正常,动作优雅连贯不僵硬。→ 适用:节日祝福视频、古风混剪、汉服推广内容
→ 参考图建议:上传一张古装人物照锁定妆造,效果远好于纯文字描述
怎么改:把"红色汉服"换成"白色纱裙""青色旗袍";把"灯笼长廊"换成"桃花林""月下宫殿";把"缓慢起舞"换成"缓慢拂袖""轻轻抬手拈花"。记住——舞蹈动作拆成"一个优雅慢动作",别写"旋转三圈后下腰"。
探索场景 3:机甲战士对战怪兽(科幻)

@图片1 参考机甲战士的造型和配色
一架银蓝色重型机甲战士,在暴雨中的废墟城市缓慢抬起右臂蓄力,拳头发出蓝色能量光芒,面前一头巨型怪兽张开大口咆哮,雨滴在慢镜头中悬浮空中,闪电照亮整个天际。中景,镜头从低角度缓慢仰拍,赛博朋克暗调,冷蓝色主调,电影感强烈,慢动作史诗感,4K超高清,画面稳定无抖动,细节锐利,光影层次分明。→ 适用:科幻短片、游戏宣传、特效类内容
→ 参考图建议:上传机甲设计稿或概念图锁定造型,避免模型随机生成的机甲不符合预期
怎么改:把"银蓝色机甲"换成你想要的配色;把"废墟城市"换成"外太空""深海";核心技巧——打斗场景用"蓄力瞬间""慢镜头定格"来表现力量感,而不是写"快速连续出拳"。
💡 注意:避免使用知名 IP 形象(如奥特曼、高达等)生成内容并公开发布,可能涉及版权风险。用原创机甲设计 + 参考图是更安全的做法。
![[16.mp4]]
探索场景 4:邵氏武侠风(复古港片)

@图片1 参考邵氏武侠电影的色调和画面质感
一位身穿白色劲装的剑客,束发长髯,手持长剑立于月夜荒野客栈前,衣袍被风缓缓吹起,剑客缓慢拔剑出鞘,剑身反射冷白月光,眼神凌厉地缓缓扫向画面左侧。中景,镜头从侧面缓慢推近到面部特写,70 年代港片胶片质感,画面偏暖偏黄,轻微颗粒感,高对比度明暗,布光戏剧性强,侧面硬光勾勒面部棱角,暗部深沉,邵氏武侠古装片风格,4K超高清,面部稳定不变形,五官清晰,人体结构正常,动作连贯自然不僵硬。→ 适用:复古武侠混剪、港片致敬、怀旧风格短视频
→ 参考图建议:上传一张邵氏经典武侠电影截图(如《独臂刀》《大醉侠》《天涯明月刀》画面),让模型学那种高对比度、暖黄调、硬光布景的复古港片质感
怎么改:把"白色劲装剑客"换成"红衣女侠""黑衣蒙面刺客";把"荒野客栈"换成"竹林小径""悬崖瀑布旁";核心技巧——邵氏风的灵魂在布光和色调(侧面硬光、暖黄底色、高对比暗部),而不是打斗动作。动作仍然要慢:拔剑、收势、回眸,每一个都是定格感的"亮相"。
进阶用法:时间线分段
想在一条视频里做镜头切换?按秒分段写:
0-3秒:近景特写女生脸部,柔光照亮面部轮廓,微微闭眼
3-6秒:镜头缓慢拉远到中景,女生睁眼轻轻转头
6-10秒:全景,女生起身缓步走向窗边,阳光洒入注意别贪多——Seedance 2.0 单次 4-15 秒,一条提示词里超过 2-3 个镜头变化,模型就容易乱套。
进阶用法:视频延长的提示词衔接
前面说过"先出 5 秒,满意再延长"。但延长段的提示词怎么写?直接复制原来的提示词?还是从头写?
衔接三原则:
- 1. 保留约束词——延长段必须重复原始提示词里的约束词(面部不变形、服装一致等),否则后段人物可能"变脸"
- 2. 接着写新动作——不要重复原始动作,写下一个动作。模型会自动从上一段的末尾接续
- 3. 保持风格统一——风格词、色调、镜头类型跟原始段保持一致,否则前后段画面"撞色"
示例——原始段 5 秒出片后,延长 5 秒:
原始提示词(第 1 段):
一位穿白色连衣裙的女生站在花田里,缓慢转身面向镜头,微笑。中景,固定镜头,治愈清新,4K,面部稳定不变形,人体结构正常。延长段提示词(第 2 段):
女生面向镜头后,缓慢伸出右手轻触身旁的花朵,低头看花微笑,微风吹动发丝。中景,固定镜头,治愈清新,4K,面部稳定不变形,人体结构正常,保持人物样貌与服装一致。注意看:约束词完整保留,风格/镜头一致,但动作是"转身后"的下一个动作——接续而非重复。
延长段的音频怎么办?
视频延长时,音频也需要衔接。目前 Seedance 2.0 的行为是:
- • 不写音频描述:模型会自动续接环境音效,通常比较自然
- • 写音频描述:延长段会按新描述生成音频,但跟前段的衔接可能不平滑(音量突变、风格跳跃)
- • 最稳做法:延长段不写音频描述,让模型自动续接;如果对配乐有要求,最后用剪映统一替换整段音频
简单说:画面的衔接靠提示词控制,音频的衔接靠后期统一处理。别指望延长段的音频能完美接上——这是目前所有 AI 视频工具的共同短板。
还有几个坑,顺手提一下

除了前面的 5 条反常识,实操中还有几个容易踩的:
风格和光影打架
❌ 赛博朋克暗调 + 阳光明媚的午后
❌ 超高速运动 + 画面极度稳定
❌ 特写 + 展现宏大场景每对搭配都是"我全都要",模型左右为难,输出质量直线下降。写之前想一秒:这两个描述矛盾吗?
视频延长搞错时长
Seedance 2.0 支持视频延长——在现有视频后面接着生成。但注意,选的时长是"新增部分"的长度,不是总长度。你选 5 秒,是在原视频后面接 5 秒,不是把整个视频压缩到 5 秒。
音频输入 ≠ 配音
上传音频是让模型参考这段音乐的节奏、风格、音色,然后生成新的音频。它不是把你的歌直接贴到视频上。想要精确的音画同步,还是得回剪映手动对齐。
不加约束词 = 裸奔
不管什么场景,提示词末尾都要加约束词(具体写法见前面维度 8)。这几个词是安全带,不系就等着翻车。
上面说的是提前避坑。但如果已经翻车了呢?下面这张排查表帮你定位问题——
效果不好?按这个顺序排查
生成的视频不满意,先别急着重写提示词。按下面这张表从上往下逐条查,80% 的问题出在前三项:
| 症状 | 最可能的原因 | 怎么改 |
|---|---|---|
| 人脸变形、五官扭曲 | 缺约束词 | 末尾加"面部稳定不变形,五官清晰,人体结构正常,比例自然" |
| 肢体变形、手指异常 | 动作太快或太复杂 | 把动作改慢:快速→缓慢,跳跃→轻轻抬脚,大幅度→微微 |
| 画面混乱、主体不清 | 塞了太多主体或动作 | 砍到"一个主体 + 一个核心动作",多余的拆成下一条视频 |
| 风格诡异、画面违和 | 描述自相矛盾 | 检查有没有"赛博朋克 + 阳光明媚""特写 + 宏大场景"这种冲突 |
| 画面模糊、细节丢失 | 画质词不够 / 分辨率低 | 加"4K超高清,细节丰富,锐度清晰";调试完用 2K 出正式版 |
| 跟参考图完全不像 | @引用没绑对 / 引用描述不够 | 鼠标悬停确认素材对应关系;加"保持人物样貌与服装一致" |
| 后半段动作偏移 | 视频太长 | 缩短到 5-6 秒先出满意的,再用"视频延长"接后段 |
| 每次生成结果差异大 | 提示词太短,模型靠猜 | 补到 80-200 字,覆盖动作+镜头+画质+约束四个必写维度 |
排查口诀:约束 → 动作 → 主体 → 风格 → 画质 → 引用 → 时长 → 长度。按这个顺序改,每次只改一个变量,才能定位到底哪里出了问题。一次改三处,好了也不知道是哪个起了作用。
Sora / Kling / Seedance 选谁?看你要什么

手上已经有别的工具的话,看这张表就够了:
| 你要什么 | 选什么 | 理由 |
|---|---|---|
| 精准控制画面(丢参考素材照做) | Seedance 2.0 | 唯一四模态 @引用 |
| 2K 分辨率 | Seedance 2.0 | 截至目前行业最高 |
| 画面+音效+配乐一次出 | Seedance 2.0 | 音画一体 |
| 最真实的物理效果 | Sora 2 | 物理模拟能力最强 |
| 最自然的运动和皮肤质感 | Kling 3.0 | 人物渲染领先 |
| 最好的光影艺术 | Veo 3.1 | 光影渲染世界级 |
| 预算有限 | Seedance 1.5 Pro | 性价比最高 |
一句话:需要可控性(给参考让 AI 照做),Seedance 2.0 目前没对手。要单纯的画质美感或物理真实度,其他工具各有强项。
Seedance 2.0 vs 1.5 Pro:什么时候不用上 2.0
2.0 不是所有场景都比 1.5 Pro 好。如果你在乎积分消耗,看这张表:
| 场景 | 选 2.0 | 选 1.5 Pro |
|---|---|---|
| 需要 2K 分辨率 | ✅ | ❌(最高 1080p) |
| 需要多模态 @引用 | ✅ | ❌(不支持) |
| 需要原生音频 | ✅ | ❌ |
| 简单的文生视频(风景、氛围) | 能用但贵 | ✅ 够用,省积分 |
| 快速迭代测试提示词 | 能用但慢 | ✅ 更快出结果 |
| 短时长单一动作(≤5 秒) | 能用 | ✅ 性价比更高 |
实操建议:调试阶段用 1.5 Pro 快速验证提示词方向,确认效果后切 2.0 出正式版。别拿 2.0 当草稿纸。
Seedance 2.0 做不到什么(已知局限)
前面零散提到了一些,这里集中汇总,避免你踩坑后才发现:
| 局限 | 说明 | 替代方案 |
|---|---|---|
| 不读负面提示词 | 写了 Negative Prompt 等于白写 | 翻转为正向描述(详见反常识 #1) |
| 不支持权重语法 | (masterpiece:1.5) 这种写法无效 | 用自然语言强调重要元素 |
| 无 Seed 值 | 无法通过固定 seed 复现完全一致的结果 | 提示词越详细,结果一致性越高 |
| 不支持 LoRA / 自定义模型 | 无法加载第三方风格模型 | 用 @引用风格参考图替代 |
| 无法精确音画卡点 | 原生音频不支持逐帧对齐 | 剪映手动对齐 |
| 无法完全静音 | 不写音频描述时仍可能生成环境音 | 后期用剪映静音 |
| 长视频后段易偏移 | 超过 8 秒后动作/面部稳定性下降 | 先出 5 秒,满意后用"视频延长" |
| 多主体表现差 | 2 个以上主体容易互相干扰 | 一个视频一个主体,后期合成 |
| 快动作必翻车 | 剧烈运动导致变形 | 所有动作改慢(详见反常识 #2) |
这些局限是截至 2026 年 2 月的情况。AI 视频工具迭代很快,部分限制可能在后续版本中改善。
批量出片工作流
做内容的人不会一次只出一条视频。如果你需要批量生产(比如一次做 10 条短视频素材),建议把 Seedance 当成「素材工厂」,用一套标准化流程来跑。
Step 0:先定一套统一的命名规则
先解决一个最容易被忽略、却最影响效率的问题:素材命名。约定一套全组通用的规则:
- • 人物照片:
role_角色名_编号.jpg(例:role_girl_a_01.jpg) - • 场景照片:
bg_场景关键词_编号.jpg(例:bg_cafe_01.jpg) - • 运镜参考视频:
cam_机位_用途_编号.mp4(例:cam_push_in_01.mp4) - • 配乐 / 音频:
bgm_情绪_节奏_编号.mp3(例:bgm_chill_90bpm_01.mp3)
这样写提示词时,用 @图片1 作为人物形象 就不会怀疑自己到底绑的是哪张图。Step 1:一次性定好「一批内容的骨架」
针对一个账号 / 一个活动,团队一起先定 3 件事:
- 1. 这批视频的目的:涨粉 / 带货 / 日更陪伴 / 课程预告…
- 2. 统一的视觉基调:日系清新 / 赛博朋克 / 写实纪录片…
- 3. 可以反复复用的 3–5 个场景模板:
- • 比如:人物情绪特写 / 商品极致特写 / 氛围 B-roll / 城市街景穿插…
这一层确定好了,后面就只是「在同一套画面结构里换内容」,而不是每条都从零设计。
Step 2:给每个场景写一条「母版提示词」
选出 3–5 个常用场景,每个写一条「母版」——就是用本文的 8 维度公式写满、全组可以复制改词的那种。
- • 母版原则:
- • 主体 + 动作 + 场景 + 光影 + 镜头语言 + 风格 + 画质 + 约束 至少覆盖 6 项;
- • 和具体商品 / 话题强相关的词,留成【可替换槽位】。
示例(商品极致特写母版):
【商品名称】放在画面中央,放大到几乎填满画面,表面【玻璃/金属/陶瓷】质感清晰可见,【液体/纹理】缓慢流动,形成细腻的高光和阴影。特写镜头,缓慢推近,画面稳定无抖动,4K超清,细节锐利,背景完全虚化成柔和的【主色】渐变光斑,高级极简风格,整体偏暗调,冷色调打光,哑光质感,无杂物干扰,画面干净整洁。成员只要替换【商品名称】【玻璃/金属/陶瓷】【液体/纹理】【主色】,就能快速产出一批风格统一的素材。
Step 3:新人必须过一遍「出片前自检表」
在团队内部约定:任何人点「生成」前,必须过一遍这 6 条(可以贴在工位):
- • 这条视频里,是否只有 一个主体 + 一个核心动作?
- • 提示词里有没有写「慢、缓慢、轻轻、丝滑、稳定」这类词?
- • 有没有任何「不要、no、Negative、禁止」这类负面词?(有就删)
- • 有没有明确的镜头描述?(近景 / 中景 / 远景 + 推 / 拉 / 横移 / 环绕 / 固定…)
- • 有没有写「画面稳定无抖动 + 面部/人体不变形」这类约束?
- • 如果用了 @引用:鼠标悬停检查一遍,标签是否指向了你想要的素材?
任何一条「否」,先改提示词,再生成。你会发现,团队整体出片质量会明显抬一档。
Step 4:生产节奏——3 版提示词 × 每版 2–3 条
比起一条提示词死磕、疯狂重刷,更高效的方式是:
- 1. 针对同一个选题,写 3 个不同风格的提示词版本(比如:治愈 / 记录感 / 暗调高级)。
- 2. 每个版本 先出 2–3 条,不要贪多。
- 3. 人肉筛一遍:
- • 丢掉明显翻车的(人物崩坏 / 光影糊 / 运镜乱晃);
- • 挑出各版本里最好的一条,进剪映二次剪辑。
你要的是「一支能上的片」,不是「十支半残片」。
Step 5:调试用低配,出片用高配
把上面的流程和前文的参数建议串起来,就是一句话:
- • 调试:1.5 Pro + 1080p + 5 秒,快速验证提示词方向;
- • 出片:Seedance 2.0 + 2K + 目标时长,出正式版;
- • 延长:对满意的视频用「视频延长」接到目标长度;
- • 收尾:导入剪映,拼接 + 配音 + 字幕 + 精调音频 → 导出成片。
别拿 2.0 + 2K 当草稿纸,10 条视频全部用高配调试,积分和时间都扛不住。
💡 进阶技巧:把写好的提示词存到一个文档里当「提示词库」。下次做类似内容时直接从库里调,改几个关键词就能用,不用每次从零写。
提示词 Checklist:写完对照,10 秒钟

每次写完提示词,过一遍这个清单:
⚠️ 必查项:
- • 主体明确?闭眼能想出画面?
- • 动作是慢的、连续的?没写"快速""剧烈""跳跃"?
- • 景别写了?特写 / 近景 / 中景 / 全景
- • 运镜写了?推镜 / 拉远 / 横移 / 环绕 / 固定
- • 加了"画面稳定""无抖动"?
- • 画质词加了 4-6 个?4K / 高清 / 电影质感
- • 角色稳定约束加了?面部不变形 / 五官清晰 / 结构正常
- • 提示词在 80-200 字区间?不要太短也不要太长
- • 用中文写的?没有专门翻译成英文?
💡 建议查:
- • 没有自相矛盾的描述?暗调 vs 阳光明媚?
- • 一个主体 + 一个核心动作?
- • 没写负面提示词?没用权重语法
(xx:1.5)? - • 用了 @引用的话,悬停确认了素材对应关系?
- • 生成参数选对了?时长 / 分辨率 / 画面比例
- • 图生视频的话,首帧图质量够高?(≥1024px,五官无遮挡)
前 9 项是必查项,后 6 项是建议查。前十条提示词逐项对照着写,之后就成条件反射了。
💡 建议打印:把这份 Checklist 打印出来贴在屏幕旁边(或截图保存到手机相册)。写提示词时扫一眼,10 秒钟避免 80% 的翻车。
一页纸总表:每次写 Seedance 提示词前先看一眼
核心心法(记 3 句就够):
- 1. 不写负面,只写你「要什么」。
- 2. 动作越慢越好,一个视频只讲一件事。
- 3. 先上素材再说话:@图片 / @视频 / @音频 是杀手锏。
出片公式(80–200 字,覆盖下面至少 6 项):
- • 主体:谁?长相 / 服装 / 年龄 / 特征…
- • 动作:做什么?动作是否「慢、连、稳」?
- • 场景:在哪?室内 / 室外 / 城市 / 自然 / 时间…
- • 光影:明暗关系 / 光源位置 / 色温…
- • 镜头语言:近景 / 中景 / 远景 + 推 / 拉 / 横移 / 环绕 / 固定…
- • 风格:日系 / 纪录片 / 赛博朋克 / 商业广告…
- • 画质:4K / 2K、清晰度、细节丰富…
- • 约束:画面稳定无抖动、面部不变形、人体结构正常、同一角色一致…
3 步自检:
- 1. 提示词里是否出现了任何「不要 / Negative / no blur」?→ 有就删。
- 2. 是否只有 1 个主体 + 1 个核心动作?→ 否的话拆成两条视频。
- 3. 是否明确写了镜头和约束?→ 没写就补上再生。
用最简单的话总结这篇文章:「多给画面,少给形容词;多给素材,少给参数;多给慢动作,少给大动作。」
练一下:改写这 3 条错误提示词
读十遍不如改一遍。下面 3 条提示词各犯了不同的错,试着自己改完再看参考答案。
练习 1——犯了几条规则?
a beautiful girl dancing in the garden. Negative prompt: no blur, no ugly face, no bad anatomy👉 点击看参考改写
犯了 3 条:① 写了负面提示词 ② 用英文(中文更好) ③ "dancing"太快太模糊。改写:
一位穿粉色纱裙的年轻女生,站在开满绣球花的花园里,缓慢抬起双臂划出优美弧线,裙摆随动作轻轻飘起。中景,固定镜头,治愈清新,4K高清,面部稳定不变形,人体结构正常,动作优雅不僵硬。练习 2——信息量够吗?
一只猫在窗台上👉 点击看参考改写
只有 7 个字,远低于 80 字甜区。什么猫?什么动作?什么光线?改写:
一只橘色短毛猫蹲在木质窗台上,阳光从窗外洒入照亮毛发,猫咪缓慢眯起眼睛,尾巴轻轻摆动,窗外是虚化的绿色植物。近景,固定镜头,治愈清新,暖色调,4K超高清,细节丰富,毛发质感清晰,画面稳定。练习 3——能找出矛盾吗?
三个朋友在咖啡厅聊天,一个人在玩手机,一个在看窗外,赛博朋克暗调,阳光明媚的午后,特写镜头展现宽阔的咖啡厅全景,快速环绕运镜,4K高清,面部稳定。👉 点击看参考改写
至少 4 个问题:① 3 个主体太多 ② "赛博朋克暗调"vs"阳光明媚"矛盾 ③ "特写"vs"全景"矛盾 ④ "快速环绕"容易翻车。改写:
一位穿深色毛衣的年轻女生,坐在咖啡厅靠窗座位,双手捧着咖啡杯,缓慢抬头看向窗外,表情若有所思。近景,镜头缓慢推近到面部,室内暖黄灯光照亮侧脸,窗外冷色自然光形成冷暖对比,韩系氛围感,4K超高清,面部稳定不变形,五官清晰,画面稳定无抖动。三句话收尾

Seedance 2.0 的核心逻辑:
- 1. 给参考,别许愿——多模态 + @引用,比纯写字精准十倍
- 2. 动作写慢,约束写全——慢动作 + 稳定约束 = 不翻车
- 3. 具体化一切——每个词都要有画面,别用空洞形容词
还记得开头那个朋友吗?后来他用本文的公式重写了提示词:删掉所有负面提示词,动作全部改慢,加上约束词。同一个"人物转身"场景,第一次就出了一条他自己都不敢相信的视频——人脸稳定、动作流畅、光影自然。他说:"就这么简单?"
就这么简单。
工具还在快速迭代中。但提示词的基本功不会过时——不管模型怎么升级,"说清楚你要什么"这件事永远是你能做的最有价值的操作。
你的第一个练习:打开即梦(),用模板 1(唯美人像)生成一条视频。不用改任何词,直接复制粘贴,点生成。看看效果——如果还行,试着把"淡蓝色连衣裙"换成你想要的服装,"林间小路"换成你想要的场景。这就是学会提示词最快的路径:先抄,再改,最后自己写。
第一个视频可能不完美,但第三个大概率会让你自己惊一下。
学习路径建议:先用模板出 3-5 个视频 → 理解公式各维度 → 开始自己组合写 → 尝试 @引用多模态输入。按这个顺序走,一周就能写出稳定出片的提示词。
效果不对?90% 是提示词的问题。翻出 Checklist 逐条查。
特别声明:以上内容(如有图片或视频亦包括在内)为本平台用户上传并发布,本平台仅提供信息存储服务。举报

