Seedance 2.0 提示词攻略：掌握这套公式，10 分钟出电影感视频

Seedance 2.0 提示词攻略：掌握这套公式，10 分钟出电影感视频

上周，一个做短视频的朋友找我吐槽："Seedance 2.0 不是很火吗？我写了一大段提示词，还加了负面提示词，结果生成的人脸像被微波炉转过似的。"

我看了一眼他的提示词——Negative Prompt 写了三行，动作描述是"快速跳跃旋转"，形容词堆了一排"震撼的、壮观的、极致的"。

问题不在工具。在他把用 Midjourney 和 Stable Diffusion 的老经验原封不动搬过来了。后来我帮他用本文的公式重写了提示词，同一个场景，生成质量判若两人。

Seedance 2.0 是字节跳动即梦平台（）2026 年 2 月上线的视频生成模型，脾气跟以前那些 AI 工具不太一样。这篇文章不是产品说明书，而是一份「纠偏手册 + 实操指南」——先帮你卸掉旧习惯，再装上正确姿势。

读完你能拿走的东西：一套可复制的提示词公式、10 个直接能用的场景模板（含 4 个社交媒体热门探索场景）、一份生成参数设置指南、一张效果不好时的排查表、一份写提示词时逐条对照的 Checklist，以及最关键的——搞懂 Seedance 2.0 跟其他工具到底哪里不一样。

快速导航（点击跳转）：

• 30 秒看懂 Seedance 2.0 + 平台入口
• 5 条反常识（负面提示词 · 动作越慢越好 · 别写"好看" · 一个视频一件事 · @引用杀手锏）
• 提示词公式 8 维度（含场景词库 · 光影速查表 · 运镜对比 · 提示词长度 · 中英文选择）
• 从 SD/MJ 迁移速查卡
• 音画一体
• 生成参数设置
• 10 个场景模板（含图生/文生选择 · 美食特写 · 热门探索场景）
• 踩坑 & 排查表
• 工具对比 & 已知局限
• 批量出片工作流
• Checklist & 练习

谁适合读这篇？怎么读最省时间

这篇更像是你团队里的「Seedance 出片操作手册」，不同读者可以这样用它：

• 【小白创作者】刚开始玩 AI 视频

• 只看：「5 分钟超懒人 SOP」→ 「反常识 1–3」→ 挑 2 个模板照抄。
• 目标：先稳定出 2–3 条「不翻车」的视频，再考虑花活。

• 【从 MJ / SD 迁移过来的老玩家】

• 只看：「迁移速查卡」→ 「8 维度公式」→ 「@引用杀手锏」。
• 目标：把原来那一套英文关键词 + 参数调优心智，换成 Seedance 的「素材 + 中文句子」心智。

• 【内容团队 / 工作室】要批量出片

• 只看：「批量出片工作流」→ 「10 个场景模板」→ 「Checklist & 排查表」。
• 目标：做一套你们自己的团队 SOP，让新人照着就能出片。

建议收藏：第一次可以从头到尾读一遍，之后把「迁移速查卡 / 模板索引 / Checklist」当成工具随时翻。

5 分钟超懒人 SOP（适合第一次体验）

如果你只想先搞出一条像样的视频，先照着这一段一步步来，不要改流程。

1. 打开即梦平台 jimeng.jianying.com → 登录 → 左侧点「AI 视频」。
2. 顶部模型切到 Seedance 2.0。
3. 生成模式选 「文生视频」。
4. 右侧参数这样选：

• 时长：5 秒
• 分辨率：1080p
• 画面比例：9:16（适合刷短视频）

5. 复制下面这条模板，原样粘进去，只改 2 个词：季节 + 场景。

一位穿白色亚麻连衣裙的年轻女生，长发微卷自然垂落，站在【春日午后】的【日式庭院木廊】上，樱花花瓣缓缓飘落在肩头和发间。近景，缓慢推镜，暖光从侧面洒入，柔光散射，日系清新暖色调，画面稳定无抖动，4K超高清，面部清晰不变形，五官自然，细节丰富，电影质感。

6. 点「生成」，等进度条跑完。
7. 做一件事：对照后文的「8 维度公式」，看看这条提示词里，你以前完全没写过的是哪几个维度。

想系统学的话，预留 20 分钟，从头到尾读完，并把后面的 3 道练习题都亲手改一遍，一周内就能形成提示词肌肉记忆。

30 秒看懂 Seedance 2.0：三个词概括它的定位

拆操作之前，先看数据（2026 年 2 月）：

维度	Seedance 2.0	Kling 3.0	Sora 2	Veo 3.1
开发商	字节跳动	快手	OpenAI	Google
最高分辨率	2K（2048×1080）	1080p	1080p	1080p
最长时长	15 秒	10 秒	12-25 秒	8 秒
图片输入	最多 9 张	1-2 张	1 张	1 张
视频输入	最多 3 个	❌	❌	❌
音频输入	最多 3 个	❌	❌	❌
原生音频	✅	✅	✅	✅
核心优势	可控性 + 多模态	运动质感	物理模拟	光影渲染

数据截至 2026 年 2 月，各产品可能随版本更新变化。

三个词概括 Seedance 2.0：多模态输入（图片+视频+音频+文本四种素材任意组合）、2K 分辨率（截至目前行业最高）、音画一体（画面和声音一次出来）。

Sora 赢在物理模拟精准，Kling 赢在运动质感和皮肤渲染，Seedance 2.0 赢在可控性——你不用写一段话"许愿"让 AI 猜，而是丢一组参考素材进去，告诉它"照这个来"。

怎么做到的？靠 @引用系统和提示词公式。不过在讲"正确姿势"之前，先说说大多数人一上手就踩的坑。

1 分钟找到入口

第一次用的话，按这个路径走：

1. 打开即梦平台：（需登录字节跳动/抖音账号）
2. 左侧菜单找到 「AI 视频」 入口
3. 顶部切换模型为 「Seedance 2.0」（默认可能是 1.5 Pro，记得手动切换）
4. 选择生成模式：

• 「文生视频」：只写提示词，不传素材——适合第一次体验
• 「全能参考」：上传图片/视频/音频 + 写提示词——适合需要 @引用的场景
• 「首尾帧」：只上传 1 张首帧图——适合简单的图生视频

5. 右侧设置面板选 时长、分辨率、画面比例（具体怎么选见生成参数章节）

6. 写好提示词，点 「生成」

💡 新手推荐路径：选「文生视频」→ 模型选 Seedance 2.0 → 复制本文任意模板 → 时长 5 秒 → 分辨率 1080p → 点生成。30 秒搞定第一次体验。

反常识 #1：负面提示词？别写了

用过 Stable Diffusion 的人，基本都养成了写 Negative Prompt 的肌肉记忆——"no blur, no distortion, no extra fingers"。

Seedance 2.0 对这套完全无感。

模型不会读负面提示词。你写了，它当没看见。更亏的是，你把精力花在列"不要什么"的清单上，真正该写的正向描述反而不够具体，效果自然差。

做法很简单，把"不要"翻转成"要"：

你的老习惯	Seedance 的正确写法
Negative: 不要模糊	画面锐度清晰、细节丰富
Negative: 不要变形	面部稳定不变形、五官清晰、人体结构正常
Negative: 不要抖动	画面稳定、无抖动、丝滑流畅
Negative: 不要多余手指	人体比例自然、结构正常

说白了，Seedance 2.0 的规矩就一条：只告诉它你要什么，别告诉它你不要什么。翻转完之后，这些正向描述就变成了后面公式里的"约束词"——先记住翻转思路，具体怎么写后面维度 8 会详细讲。

试一下——同一个"人物转身"场景，错误写法 vs 正确写法：

❌ 错误（带负面提示词）：

一位女生在花园里转身。Negative Prompt: no blur, no distortion, no extra fingers, no deformation, 不要模糊，不要变形

✅ 正确（全部翻转为正向描述）：

一位穿白色棉麻衬衫的年轻女生，站在开满玫瑰的花园里，缓慢转身面向镜头，表情自然微笑，阳光从侧面洒下柔和光影。近景，固定镜头，画面锐度清晰，细节丰富，面部稳定不变形，五官清晰，人体结构正常，比例自然，画面稳定，无抖动，4K高清，电影质感。

把右边这条直接复制到 Seedance 2.0 试试，感受一下"全正向描述"的效果。

来源：Seedance AI 官方提示词指南（seedance-ai.site）

反常识 #2：动作越慢，视频越好

这条最违反直觉。

你想做个"酷炫"视频，本能地写"人物在街上飞速奔跑，跳过障碍物，翻转落地"。结果——人体变形严重，肢体比例完全失控。

原因不复杂：AI 视频模型本质上是在帧与帧之间做插值预测。动作越快、幅度越大，两帧之间的差异就越大，模型"猜错"的概率就越高。

记住三个字：慢、连、稳。

动作类型	❌ 翻车写法	✅ 稳定写法
人物移动	快速跳跃、剧烈跑动	缓慢转身、轻轻抬手、微微低头
表情变化	大笑、夸张尖叫	嘴角微微上扬、眼神慢慢看向镜头
环境动态	狂风暴雨、爆炸	微风轻拂头发、树叶缓缓飘落
镜头动作	快速甩镜、急推	镜头缓缓推进、轻微环绕、平稳跟拍

有个简单的判断方法：你拿手机用慢镜头能拍出来的动作，Seedance 基本都能做好；需要高帧率运动相机抓拍的那种——大概率翻车。

推荐词库：缓慢、轻柔、连贯、自然、流畅、不僵硬。

试一下——同一个"女生走路"场景，快动作 vs 慢动作：

❌ 错误（快+大幅度）：

一个女生在街上飞快奔跑，跳过台阶，头发大幅甩动，裙摆剧烈飘动，快速转弯冲向镜头

✅ 正确（慢+连贯+小幅度）：

一位穿米色风衣的年轻女生，在秋日的银杏大道上缓慢行走，脚步轻盈，微风轻拂发丝，落叶缓缓飘落在肩头，女生微微侧头看向远方，表情宁静自然。中景，镜头缓慢跟拍，画面丝滑流畅，无抖动，治愈清新风格，暖色调，4K高清，面部稳定不变形，人体结构正常，细节丰富。

复制右边这条到 Seedance 2.0，注意看人物行走时身体是否自然连贯——这就是"慢"带来的稳定性。

反常识 #3：别写"好看"——给画面，别给形容词

"一个很美的场景，画面很好看。"

这句话 Seedance 听到等于什么都没听到。"美""好看"是人类的主观评价，没有视觉锚点，模型不知道你脑子里想的是日式庭院还是赛博朋克。

原则：每个形容词都必须能被画出来。

❌ 空洞描述	✅ 具体描述
很美的女生	穿白色亚麻连衣裙的年轻女生，长发微卷
好看的风景	春日午后的日式庭院，樱花花瓣缓缓飘落
酷炫的画面	夜晚城市天际线，霓虹灯光倒映在湿润地面
画面很丰富	前景樱花枝条、中景人物、背景远山，三层构图
高级感	暗调、极简构图、冷色调打光、哑光质感

风格描述也一样。别写"唯美"，写"治愈清新、日系暖色调、柔光散射"。别写"高级"，写"赛博朋克、暗调、极简干净"。

你会发现，提示词写得具体之后，连生成时间都会缩短——因为模型不需要"瞎猜"了。

试一下——同一个"好看的场景"：

❌ 错误（空洞形容词）：

一个非常唯美的画面，一个漂亮的女生在很好看的风景里，画面很美，氛围感很强

✅ 正确（每个词都有画面）：

一位穿白色亚麻连衣裙的年轻女生，长发微卷自然垂落，站在春日午后的日式庭院木廊上，樱花花瓣缓缓飘落在肩头和发间。近景，缓慢推镜，暖光从侧面洒入，柔光散射，日系清新暖色调，画面稳定无抖动，4K超高清，面部清晰不变形，五官自然，细节丰富，电影质感。

对比两条提示词的区别：右边每个描述都能"画"出来——白色亚麻裙、日式庭院、侧面暖光。试试生成效果。

反常识 #4：一个视频只讲一件事

"三个人在公园里野餐，一个人在弹吉他，一个在拍照，还有一只狗在旁边跑来跑去，天空有飞机飞过。"

4 个主体，5 个动作。你脑子里有画面，Seedance 脑子里是混乱——它试图同时渲染所有东西，结果每个都做不好。

一个视频 = 一个主体 + 一个核心动作。 这是铁律。

❌ 三个人在公园里野餐，一个弹吉他，一个拍照，一只狗跑来跑去

✅ 一位年轻女生在公园草地上弹吉他，微微低头看琴弦，阳光洒在侧脸上

需要多人多动作？拆成多个视频分别生成，用剪映拼接。Seedance 2.0 单次生成 4-15 秒，拆分+拼接才是正经的工作流。

试一下——把上面的"公园弹吉他"正确版直接拿去生成：

一位穿格子衬衫的年轻女生，坐在午后公园的草坪上弹吉他，微微低头看琴弦，手指轻轻拨弦，阳光从侧面洒在脸上形成柔和光影，背景是虚化的绿色草地。中景，固定镜头，画面稳定无抖动，治愈清新风格，4K高清，面部清晰不变形，人体结构正常，动作自然流畅，不僵硬，细节丰富。

一个主体（女生）+ 一个核心动作（低头拨弦）+ 一个简单场景（草坪）。生成后感受一下"聚焦"带来的画面质量。

反常识 #5：别光写文字——@引用才是杀手锏

大多数人打开 Seedance 2.0，跟用 ChatGPT 一样——在框里写一段话，点生成。

这只用到了它 30% 的能力。

Seedance 2.0 最大的升级叫多模态输入：你可以把图片、视频、音频一起丢进去，然后用 @ 符号告诉模型，每个素材分别干什么。

具体操作

1. 选「全能参考」入口（别选「首尾帧」入口，那个只支持单张图片）
2. 拖拽上传素材：图片最多 9 张、视频最多 3 个（总时长 ≤15 秒）、音频最多 3 个（总时长 ≤15 秒），混合总上限 12 个文件
3. 在提示词里用 @ 分配任务：

@图片1 作为首帧人物形象
@图片2 参考场景背景
@视频1 参考镜头运动方式
@音频1 用于背景配乐
人物缓慢转身微笑，微风吹动头发，镜头平稳跟随，画面稳定，4K高清，面部不变形

在输入框直接打 @ 就能唤起引用面板，也可以点工具栏的 @ 按钮。操作成功后，输入框里会出现带颜色的标签，标签上显示素材文件名——看到这个就说明引用已绑定。

各素材怎么用

素材类型	干什么用	写法示例
图片	锁定人物五官/服装/场景	@图片1 作为首帧，保持人物样貌
视频	复刻运镜/动作/转场	@视频1 参考镜头语言和运镜
音频	定调节奏/配乐参考	@音频1 用于配乐
多图	角色+场景分别指定	@图片1 人物形象 @图片2 场景风格

三个容易踩的坑

坑一：@引用对错号。 上传了 3 张图，想用第 2 张当首帧，@图片1 却指向了第 1 张。写完之后鼠标悬停确认一下，3 秒钟能省 3 分钟等待。

坑二：拿图片当视频引用。 上传的是静态图片，提示词却写"参考 @图片1 的运镜"——静态图片哪来的运镜？没意义。

坑三：混淆"参考"和"编辑"。 这两个用途完全不同：

• "参考 @视频1 的运镜" = 学这个运镜方式，内容重新生成
• "将 @视频1 中的女生换成花旦" = 在这个视频上改

@引用系统是 Seedance 2.0 的独家能力。截至目前，Sora、Kling、Veo 都没有同等级别的多模态组合输入。

试一下——完整的多模态 @引用提示词（上传 2 张图片 + 1 个视频后使用）：

@图片1 作为首帧，保持人物的面部特征和服装不变
@图片2 参考场景的色调和氛围
@视频1 参考镜头的运动方式和节奏
人物站在画面中央，缓慢抬起右手拢了一下耳边的头发，微微侧头，嘴角自然上扬，目光缓缓看向镜头右侧。近景，画面稳定无抖动，丝滑流畅，暖色调，4K高清，面部稳定不变形，五官清晰，同一角色，服装一致，发型不变。

准备好你的参考素材（人物照片 + 场景照片 + 运镜参考视频），用「全能参考」入口上传后粘贴这条试试。

从 SD/MJ 迁移到 Seedance 2.0：速查卡

如果你之前用 Stable Diffusion 或 Midjourney，这张表是前面 5 条反常识的浓缩版，加上 SD/MJ 用户特有的 4 条习惯差异（权重语法、参数调优、ControlNet、LoRA），帮你一张表完成认知切换：

你的旧习惯（SD / MJ）	Seedance 2.0 正确做法	原因
写 Negative Prompt 三行起步	删掉全部负面提示词	模型不读，写了浪费字数
英文提示词效果更好	直接写中文	字节训练的模型，中文理解力原生级别
关键词用逗号隔开：girl, garden, smile, 4K	写完整句子描述连贯场景	Seedance 理解语句逻辑，不是关键词匹配
堆叠权重语法：(masterpiece:1.5)	不支持权重语法，写自然语言	没有这个机制，写了会被当成普通文字
CFG Scale / Steps / Sampler 等参数调优	只有时长、分辨率、比例三个参数	底层架构不同，无需也无法微调采样参数
ControlNet / IP-Adapter 精确控制	@引用系统 + 多模态素材	用图片/视频/音频素材替代插件控制
Seed 值锁定复现结果	暂无 seed 机制，靠详细提示词降低随机性	提示词越精确，结果一致性越高
LoRA 模型切换风格	在提示词里写风格词 + @引用风格参考图	不支持自定义模型，用参考图替代
只写画面描述	加运镜 + 约束词	这是视频不是图片，镜头语言和稳定约束必写

一句话总结迁移心法：从"参数调优"转向"素材+语言描述"，从"关键词拼接"转向"写句子讲故事"。

提示词核心公式——8 个维度拆解

聊完反常识，进入最核心的部分。在我的使用经验中，提示词是影响出片质量最关键的变量。

万能公式：

主体 + 动作 + 场景 + 光影 + 镜头语言 + 风格 + 画质 + 约束

8 个维度不用每次写全，但有 4 个是必写项：动作、镜头、画质、约束。其余按需组合。

先回答两个"元问题"

在拆维度之前，先解决两个大家最常问的问题：

提示词写多长合适？

我的经验：80-200 字是甜区。

• 低于 50 字：信息量不够，模型靠猜，结果随机性大。"一个女孩在海边"只有 7 个字，模型要自己决定长相、服装、动作、光影、镜头——每个变量都是赌骰子。
• 80-200 字：刚好覆盖公式的核心维度，模型有足够信息，又不会被噪音干扰。本文所有模板都在这个区间。
• 超过 300 字：信息过载，后面的描述权重会被稀释。模型不是"写越多越听话"，而是"越精准越听话"。实测超长提示词反而容易丢掉后半段的描述。

简单记：一条提示词 = 一条微博的长度，差不多就对了。

中文写还是英文写？

直接写中文。Seedance 2.0 是字节跳动训练的模型，对中文的理解力是原生级别的。实测下来：

• 纯中文：效果最稳，尤其是国风、日系、写实等场景，中文描述比英文更精准
• 纯英文：也能用，但不会比中文更好，没有必要专门翻译
• 中英混写：部分专业术语可以混用（如"bokeh""tilt-shift""cinematic"），但主体描述建议用中文

跟 Midjourney、Stable Diffusion 不同——那些模型训练数据以英文为主，所以英文提示词效果更好。Seedance 2.0 不存在这个问题。别再把中文提示词翻译成英文了，浪费时间。

维度 1：主体

写清楚"谁"或"什么"。具体到能在脑子里画出来。

✅ 一位穿淡蓝色连衣裙的年轻女生，长发微卷，戴着细框眼镜
✅ 一只橘色短毛猫，蹲在窗台上
❌ 一个女孩（太泛了，什么样的女孩？）
❌ 一个好看的人（"好看"不是视觉信息）

维度 2：动作（最重要）

前面讲过了——慢、连、稳。

推荐动词：缓慢转身、轻轻抬手、脚步轻移、微微低头、随风摆动。

多动作串联时，按时间顺序写清连接关系：

人物缓慢抬起右手，轻触额前头发，微微侧头，嘴角自然上扬，视线缓缓看向镜头

维度 3：场景

交代背景和空间感。场景写得越具体，模型"瞎猜"的空间越小。

在林间小路上，两旁是高大的银杏树，地上铺满金色落叶
海边，日落时分，天空呈暖橙色渐变

常用场景词库——按类型快速查找：

类型	场景关键词
室内·生活	咖啡馆靠窗座位、卧室落地窗前、厨房大理石台面、书房木质书架旁
室内·商业	极简白色摄影棚、暗调展厅聚光灯下、办公室落地玻璃窗前
户外·自然	银杏大道、樱花树下、海边礁石、山间竹林、湖边木栈道、薰衣草花田
户外·城市	霓虹灯街道、雨后柏油路面、天台远眺城市天际线、老城区石板巷
虚构·奇幻	浮空岛屿、水晶宫殿、蒸汽朋克工厂、外太空空间站、水下废墟城市

场景描述的技巧：写一个具体空间 + 1-2 个环境细节。"花园"太泛，"开满绣球花的日式庭院，石板小路上有落花"就够了。

维度 4：光影

光影是决定氛围和色温的关键维度——同一个场景，换一种光，情绪完全不同。

暖光透过窗户洒在脸上
侧逆光勾勒出轮廓线
阳光透过花瓣投下斑驳光影

场景 × 光影速查表——直接查你的场景适合什么光：

氛围目标	光影关键词	典型场景
温暖治愈	暖黄阳光、柔光散射、侧面暖光洒在面部	日系人像、咖啡馆、午后花园
唯美梦幻	逆光轮廓光、光晕（lens flare）、金色光斑	日落人像、花田、海边
高级冷调	冷色自然光、侧面硬光、阴影明显	商业大片、城市夜景、室内极简
戏剧张力	侧逆光、伦勃朗光（三角光）、明暗对比强烈	武侠、悬疑、电影感人像
纪实真实	自然光线、无人工打光、环境光	纪录片、街拍、Vlog
夜景氛围	霓虹灯光映在脸上、冷蓝紫色调、湿润地面反光	赛博朋克、城市夜景、雨夜
恐怖悬疑	底部打光、单侧硬光、大面积暗部、惨白冷色	悬疑短片、恐怖氛围

技巧：光影词和风格词要配套。写了"赛博朋克"风格，就配"霓虹灯光""冷蓝紫色调"；写了"治愈清新"，就配"暖黄阳光""柔光散射"。光影和风格打架是最常见的翻车原因之一（详见踩坑章节）。

维度 5：镜头语言（Seedance 的强项）

分两块——景别和运镜。

景别选择：

景别	什么时候用
特写	拍面部细节、情绪、产品特写
近景	拍表情、上半身、对话场景
中景	日常叙事、动作展示
全景	展示环境、人物全貌

运镜方式：

运镜	效果	典型场景
缓慢推镜	由远及近，代入感	开场引入、情绪递进
轻微拉远	由近及远，全貌	结尾、揭示环境
平稳横移	横向平移，空间感	展示场景宽度
环绕半圈	绕主体旋转，立体	人物展示、产品环绕
固定镜头	不动，稳定叙事	对话、静态情绪
手持稳定	微微晃但不抖	纪实感、Vlog

运镜修饰词（每次都加）：无抖动、丝滑流畅、画面稳定。

Seedance 2.0 对运镜描述的理解力很强，中文直接写就行。你写"希区柯克变焦"它也认识——当然，平时用"缓慢推镜""环绕半圈"这些够用了。

运镜的威力有多大？ 看同一个场景换运镜的效果——

同样是"一位年轻女生站在雨后的城市街头，轻轻抬头看向天空"：

【缓慢推镜版】…中景，镜头从街道远处缓慢推近到女生面部特写…
→ 效果：代入感强，观众"走向"主角，适合情绪递进、开场引入

【环绕半圈版】…中景，镜头从女生正面缓慢环绕到侧面…
→ 效果：立体感强，人物像雕塑一样被"展示"，适合人物展示、造型展示

【固定镜头版】…中景，固定机位，画面静止只有人物微微动…
→ 效果：沉静、克制，适合安静情绪、对话场景、文艺风

三条提示词只有运镜不同——但画面叙事感完全不同。推镜 = 代入，环绕 = 展示，固定 = 沉静。选运镜之前先想：这条视频想让观众感受什么？

维度 6：风格

风格词是提示词里"性价比"最高的维度——换一组风格词，同样的主体+动作出来的画面完全不同。

风格	关键词	典型场景
治愈清新	治愈清新、唯美文艺、日系清新、柔光散射	Vlog、情感短视频
韩系氛围	韩系氛围感、梦幻柔光、复古胶片、颗粒质感	人像写真、街拍
暗调高级	赛博朋克、暗调高级、极简干净、霓虹光影	科技感、城市夜景
写实纪录	真实摄影、纪实风格、自然光线、手持微晃	纪录片、新闻感
复古胶片	80 年代胶片质感、褪色暖调、颗粒感、暗角	怀旧回忆、老照片动态化
动漫二次元	日本动漫风格、赛璐珞上色、线条清晰、二次元	动漫混剪、虚拟角色
水墨国风	中国水墨画风格、淡墨渲染、留白构图、意境悠远	国风短视频、武侠
广告大片	商业广告质感、高反差、精致打光、杂志封面	产品宣传、品牌视频
MV 风格	音乐视频质感、闪切剪辑、饱和色彩、节奏感强	音乐配合、舞蹈类
3D 渲染	3D 渲染风格、皮克斯动画质感、柔和材质、全局光照	动画短片、卡通角色
黑白电影	黑白画面、高对比度、经典好莱坞、光影戏剧性强	艺术短片、情绪表达

风格词的威力有多大？ 看同一个场景换风格的效果——

同样是"一位年轻女生站在城市街头，微微侧头看向远方"：

【治愈清新版】…日系清新暖色调，柔光散射，画面明亮温暖…
【赛博朋克版】…霓虹灯光映在脸上，暗调高级，冷蓝紫色调，雨后湿润地面反光…
【复古胶片版】…80 年代胶片质感，褪色暖调，画面带颗粒感和暗角，怀旧氛围…

三条提示词除了风格和光影不同，主体、动作、镜头、约束完全一样——但生成出来是三个完全不同的世界。这就是为什么风格词值得多花 10 秒钟想清楚。

维度 7：画质（必写）

结尾选 4-6 个画质词，像加保险一样：

4K、超高清、细节丰富、锐度清晰、电影质感、色彩自然、光影柔和、无模糊、无重影、无闪烁、画面稳定

不用全堆上，挑跟你场景最相关的几个就行。

维度 8：约束（必写，防变脸保命用）

文生视频必加：

面部稳定不变形，五官清晰，人体结构正常，比例自然，动作不僵硬

图生视频再加一句：

同一角色，服装一致，发型不变，保持人物样貌与服装一致

这组约束词不是"锦上添花"，是"保命绳"。根据我的实测，不加约束直接生成时，大约一半以上的视频会出现不同程度的面部变形。加上约束词后，翻车率明显降低。

完整示例：8 个维度全上

下面这条提示词把公式的 8 个维度全部写齐了，可以直接复制使用：

【主体】一位穿深蓝色针织毛衣的年轻男生，短发干净利落，戴细框银色眼镜，
【动作】坐在咖啡馆靠窗座位，缓慢端起一杯拿铁，轻轻吹了一口热气，抿了一小口，然后抬眼看向窗外，
【场景】窗外是雨天的城市街道，玻璃上有细密雨滴，街道对面有暖色灯光的店铺，
【光影】室内暖黄吊灯照亮面部，窗外冷色自然光与室内暖光形成冷暖对比，
【镜头】近景，镜头从咖啡杯缓慢推近到人物面部，
【风格】韩系氛围感，复古胶片色调，梦幻柔光，
【画质】4K超高清，电影质感，色彩自然，光影柔和，细节丰富，画面稳定，
【约束】面部稳定不变形，五官清晰，人体结构正常，比例自然，动作自然流畅不僵硬。

注意：实际使用时不需要加【维度名】标签，这里标出来是方便你学习对照。去掉标签直接连成一段就行。

音画一体：一个工具搞定，不用再开四个软件

Seedance 2.0 有一个容易被忽略但真的很实用的能力：原生音频生成。

以前做一条完整的短视频，流程是这样的：

1. 用 AI 工具生成画面
2. 打开另一个工具生成配音
3. 再找一个工具加背景音乐
4. 打开剪映把音画对齐

四个工具来回切换，光对齐时间轴就能搞半小时。

现在用 Seedance 2.0：写一段提示词，画面+环境音效+人声对白+背景音乐一次全出来。

它具体能做这几件事：

• 环境音效：海浪声、风声、鸟叫，自动匹配画面内容
• 人声对白：支持多语言唇形同步
• 背景音乐：自动生成节奏匹配的配乐，据平台介绍无版权风险

我用前面"氛围风景"的海边日落模板试了一下，生成的视频自带了海浪拍岸的声音和一段节奏舒缓的钢琴配乐。音画匹配度大概打 80 分（如果 100 分是剪映手动精调的效果）——环境音很贴合，但背景音乐风格有时候不是你想要的。这时候可以通过 @引用上传自己的音乐素材当参考，模型会学你音乐的风格和节奏来生成新配乐。注意：这里是"参考生成"不是"直接贴上去"，想精确对齐还得回剪映。

音频怎么用提示词控制

很多人只写画面描述，音频完全交给模型随机生成。其实你可以用提示词主动控制音频效果：

你想要的音频效果	提示词写法
特定环境音效	"伴随海浪拍岸声""远处传来鸟鸣""雨滴敲打玻璃的声音"
特定配乐风格	"背景是舒缓的钢琴旋律""轻快的吉他弹唱""紧张的弦乐渐强"
音效 + 配乐同时要	"自然环境音效搭配一段舒缓的钢琴作为背景音乐"
静音/纯画面	不写任何音频描述（模型可能仍会加环境音，目前无法完全静音）
精确控制配乐风格	上传参考音频，用 @音频1 参考配乐风格和节奏（比纯文字精准得多）

关键区别：文字描述音频 = 模型自由发挥，@引用音频素材 = 模型学你给的参考。想要精确控制，优先用 @引用。

还有一个局限：如果你需要精确到帧的音乐卡点（比如卡鼓点做转场），原生音频做不到这个精度，老老实实用剪映手动对。

据 21 经济网报道，在理想条件下，Seedance 2.0 能在 60 秒内生成带原生音频的多镜头序列视频。一年前这种活要一个小团队干好几天。

试一下——一条带音频描述的完整提示词：

海边日落时分，金色阳光铺满海面，海浪轻轻拍打沙滩泛起白色泡沫，远处一只海鸥缓慢飞过画面上方。全景，镜头缓慢横移，暖橙色调，治愈清新风格，画面丝滑流畅。伴随海浪拍岸的自然音效和一段舒缓的钢琴旋律作为背景音乐，音画同步。4K超高清，无闪烁无重影，画面稳定。

生成后注意听——视频应该自带海浪声和配乐。如果配乐风格不满意，可以上传你喜欢的音乐素材，用 @音频1 参考配乐风格和节奏 让模型学着来。

别忽略生成参数：提示词只是一半

写好提示词点"生成"之前，还有几个参数要选。选错了，提示词写得再好也白搭。

时长怎么选

时长	适合场景	注意
4-5 秒	产品展示、单一动作、表情特写	最稳，翻车率最低，推荐新手从这里开始
6-8 秒	人物行走、简单叙事、氛围风景	性价比最高，大部分场景够用
10-15 秒	多段动作串联、长镜头、时间线分段	越长越容易出问题，后半段动作可能变形或偏移

新手建议：先用 5 秒出片，满意了再用"视频延长"接着生成。比一上来就选 15 秒靠谱得多——5 秒的试错成本低，15 秒生成一次要等更久，翻车了更心疼。

分辨率怎么选

分辨率	适合场景	生成速度
1080p	日常内容、测试阶段、快速迭代	快
2K（2048×1080）	最终出片、需要高画质的正式内容	慢（约 1.5-2 倍）

实操建议：调试阶段用 1080p 快速试错，确认提示词效果后，最后一次再切 2K 出正式版。别每次都用 2K 调试，浪费时间和积分。

画面比例怎么选

比例	用途
16:9	B 站、YouTube 横屏视频
9:16	抖音、小红书、Instagram Reels 竖屏
1:1	小红书封面、朋友圈视频
4:3	特殊构图需求

先想好发哪个平台，再选比例。别生成完了发现比例不对，裁剪会丢画面。

生成要等多久

别点了生成就盯着屏幕看——了解大致等待时间，可以同时准备下一条提示词：

配置	大致等待时间
5 秒 + 1080p	1-2 分钟
5 秒 + 2K	2-4 分钟
10-15 秒 + 1080p	3-5 分钟
10-15 秒 + 2K	5-8 分钟

以上为非高峰期的大致范围。高峰时段（晚间 20:00-23:00）可能需要排队，等待时间翻倍。如果超过 10 分钟没出结果，刷新页面检查是否卡住。

费用和免费额度

截至 2026 年 2 月，即梦平台的积分体系：

• 新用户：注册即送免费积分（具体数量随平台活动变化，通常够生成 10-20 条视频）
• 日常签到：每天签到可领少量积分
• 积分消耗：分辨率越高、时长越长，消耗积分越多。2K + 15 秒是 1080p + 5 秒的数倍消耗
• 付费充值：积分用完后可充值购买，具体价格见平台官网

省积分技巧：

1. 调试阶段用 1080p + 5 秒（消耗最低）
2. 确认提示词方向后再切 2K 出正式版
3. 有 1.5 Pro 选项的场景，调试用 1.5 Pro，出片用 2.0

⚠️ 平台积分政策可能随时调整，以即梦官网（）实际显示为准。

10 个场景模板：复制粘贴，改几个词就能用

不想从零写提示词？直接用模板起步。但先回答一个问题——

文生视频还是图生视频？先看这张表

你的情况	选哪个	原因
脑子里有画面，但没有参考素材	文生视频	纯靠提示词描述，模型从零生成
有一张人物照片，想让 TA "动起来"	图生视频	用照片当首帧，锁定人物形象
想复刻某个视频的运镜风格	图生/视频生视频	@引用视频素材，模型学运镜
做数字人 / 个人 IP 内容	图生视频	必须用真人照片锁脸，否则每次生成的人都不一样
做风景、产品、抽象画面	文生视频	不涉及人脸一致性，文字描述够用
第一次用，纯体验	文生视频	门槛最低，不需要准备素材

一句话总结：涉及"人脸一致性"的场景，优先图生视频；不涉及人脸的，文生视频更方便。

模板 1：唯美人像

一位穿淡蓝色连衣裙的年轻女生，在林间小路缓慢行走，微风轻拂头发，自然微笑，暖色阳光透过树叶洒下斑驳光影。中景，缓慢推镜，画面流畅稳定，无抖动。治愈清新风格，4K高清，电影感，面部清晰不变形，人体结构正常，细节丰富。

→ 适用：个人 Vlog、社交媒体短视频、情感类内容

怎么改：把"淡蓝色连衣裙"换成你要的服装，"林间小路"换成你的场景，其他保持不动。核心结构（动作+运镜+约束）不要改，这是保证质量的骨架。

模板 2：氛围风景

海边日落时分，金色阳光铺满海面，海浪轻轻拍打沙滩，远处几只海鸥缓慢飞过。全景，镜头缓慢横移，暖橙色调，治愈清新，画面丝滑流畅，4K超高清，无闪烁无重影，画面稳定。

→ 适用：旅行视频、背景素材、放松类内容

模板 3：产品展示

一瓶精致的香水放在大理石台面上，镜头从瓶身特写缓慢拉远，展现瓶身反射的光泽和周围的花瓣装饰。环绕半圈运镜，极简干净风格，高级质感，柔和打光，4K超高清，细节锐利，画面稳定。

→ 适用：电商产品视频、品牌宣传

模板 4：城市夜景

夜晚城市天际线，高楼灯光闪烁，车流在道路上形成光轨，镜头从高处缓慢推进。全景到中景过渡，赛博朋克氛围，暗调高级，霓虹色彩，4K超高清，画面稳定无抖动，电影质感。

→ 适用：城市宣传片、科技感内容

模板 5：图生视频（人物动态）

基于参考图保持人物样貌与服装一致，人物缓慢抬起右手轻触额前头发，微微侧头，嘴角自然上扬，视线缓缓看向镜头。近景，固定镜头，自然流畅，不僵硬不变形，发型服装保持一致，高清细节，电影质感，4K，面部稳定。

→ 适用：数字人、个人 IP 视频、社交媒体

首帧选图要点（图生视频的质量 80% 取决于这张图）：

要求	推荐	避免
分辨率	1024×1024 以上，越清晰越好	低于 512px 的截图、缩略图
宽高比	跟输出视频比例一致（如 16:9 选横图）	竖图做横屏视频（会被拉伸或裁切）
人脸	正脸或 3/4 侧脸，五官清晰无遮挡	侧面 90°、墨镜遮脸、刘海挡眼
人脸占比	脸部占画面 15%-40%	太小（<10%，丢细节）、太大（纯大头贴）
光线	自然光或柔光，面部无硬阴影	强逆光（脸全黑）、闪光灯直射（面部过曝）
背景	简洁干净，跟提示词场景不冲突	杂乱背景（模型可能保留背景元素干扰输出）
来源	原始照片、高清素材站	社交媒体截图（压缩严重）、带水印图片

💡 不知道去哪找高质量参考图？往后翻到热门探索场景里的**"参考图去哪找？"**，有具体的免费素材站推荐和 AI 先出图再做视频的技巧。

模板 6：美食特写

一碗热气腾腾的日式拉面放在木桌上，浓郁的白色蒸汽缓缓升起，镜头从碗沿特写缓慢推近到汤面表面，可以看到金黄色的猪骨汤底、弹韧的面条、溏心蛋的流心截面和翠绿的葱花。特写到近景，环绕半圈运镜，暖色调，美食摄影质感，柔和打光，食材质感清晰，汤汁光泽诱人，4K超高清，细节锐利，画面稳定。

→ 适用：美食探店、菜谱视频、餐饮品牌宣传

怎么改：把"日式拉面"换成你的菜品；核心技巧——美食视频的关键是材质感（光泽、蒸汽、流心、酥脆表面），而不是人物。多写食材的质感细节（"芝士缓慢拉丝""巧克力表面光泽流动""刚出锅的油光"），少写动作。

![[13.mp4]]

热门探索场景：4 个社交媒体出圈模板

下面 4 个场景是目前推特、B 站、小红书、抖音上比较出圈的 AI 视频类型。它们的共同特点：题材天然带"快动作"属性，但通过慢动作重新诠释 + @引用参考图锁定风格，反而能出惊艳效果。

⚠️ 这四个模板都建议搭配参考图使用（通过「全能参考」入口上传）。纯文字也能生成，但加参考图后风格准确度会大幅提升。

参考图去哪找？

• 免费素材站：Unsplash、Pexels、Pixabay（搜 "ink painting""hanfu""mecha concept art" 等关键词）
• AI 先出图再做视频：用 Midjourney / DALL-E / 即梦的图片生成功能先生成一张静态概念图，再丢进 Seedance 当参考做视频
• 自己的照片：做人像类内容时，手机自拍/他拍是最好的首帧素材——锁定你自己的脸

用图片做首帧（图生视频）时，图片质量直接决定输出质量。具体的分辨率、宽高比、人脸占比等技术要求，见前面模板 5 的首帧选图要点。

探索场景 1：水墨武林（中国风）

@图片1 参考水墨画风格和笔触质感
一位白发白须的老者，身穿灰色麻布长衫，在清晨山间竹林中缓慢舞剑，剑刃划过空气带出淡墨色残影，衣袂随动作轻轻飘动，薄雾在脚下缓缓流动。中景，镜头缓慢环绕半圈，中国水墨画风格，留白构图，淡墨渲染，黑白灰为主调，点缀淡青色，画面如泼墨流动，意境悠远。4K超高清，人物动作连贯自然不僵硬，面部稳定不变形，五官清晰，人体结构正常。

→ 适用：国风短视频、武侠片头、传统文化内容
→ 参考图建议：上传一张水墨画作品，让模型学画风；纯文字生成时画风偏写实，加参考图才能出水墨意境

怎么改：把"竹林"换成"雪山之巅""古寺庭院"；把"舞剑"换成"打太极""抚琴"。核心技巧——用"缓慢"重新定义武侠动作，避免快速打斗导致变形。

![[14.mp4]]

探索场景 2：古装美女节日舞（国风）

@图片1 作为人物形象参考，保持古装造型和妆容一致
一位身穿红色汉服的年轻女子，头戴金色步摇，在夜晚的灯笼长廊中缓慢起舞，长袖轻轻扬起划出优美弧线，裙摆随转身缓缓旋开，红色灯笼光映照在面庞上，花瓣缓缓飘落在肩头。近景到中景缓慢推镜，暖色调，中国传统节日氛围，柔光散射，画面丝滑流畅，无抖动，4K高清，电影质感，面部稳定不变形，五官清晰，人体结构正常，动作优雅连贯不僵硬。

→ 适用：节日祝福视频、古风混剪、汉服推广内容
→ 参考图建议：上传一张古装人物照锁定妆造，效果远好于纯文字描述

怎么改：把"红色汉服"换成"白色纱裙""青色旗袍"；把"灯笼长廊"换成"桃花林""月下宫殿"；把"缓慢起舞"换成"缓慢拂袖""轻轻抬手拈花"。记住——舞蹈动作拆成"一个优雅慢动作"，别写"旋转三圈后下腰"。

探索场景 3：机甲战士对战怪兽（科幻）

@图片1 参考机甲战士的造型和配色
一架银蓝色重型机甲战士，在暴雨中的废墟城市缓慢抬起右臂蓄力，拳头发出蓝色能量光芒，面前一头巨型怪兽张开大口咆哮，雨滴在慢镜头中悬浮空中，闪电照亮整个天际。中景，镜头从低角度缓慢仰拍，赛博朋克暗调，冷蓝色主调，电影感强烈，慢动作史诗感，4K超高清，画面稳定无抖动，细节锐利，光影层次分明。

→ 适用：科幻短片、游戏宣传、特效类内容
→ 参考图建议：上传机甲设计稿或概念图锁定造型，避免模型随机生成的机甲不符合预期

怎么改：把"银蓝色机甲"换成你想要的配色；把"废墟城市"换成"外太空""深海"；核心技巧——打斗场景用"蓄力瞬间""慢镜头定格"来表现力量感，而不是写"快速连续出拳"。

💡 注意：避免使用知名 IP 形象（如奥特曼、高达等）生成内容并公开发布，可能涉及版权风险。用原创机甲设计 + 参考图是更安全的做法。

![[16.mp4]]

探索场景 4：邵氏武侠风（复古港片）

@图片1 参考邵氏武侠电影的色调和画面质感
一位身穿白色劲装的剑客，束发长髯，手持长剑立于月夜荒野客栈前，衣袍被风缓缓吹起，剑客缓慢拔剑出鞘，剑身反射冷白月光，眼神凌厉地缓缓扫向画面左侧。中景，镜头从侧面缓慢推近到面部特写，70 年代港片胶片质感，画面偏暖偏黄，轻微颗粒感，高对比度明暗，布光戏剧性强，侧面硬光勾勒面部棱角，暗部深沉，邵氏武侠古装片风格，4K超高清，面部稳定不变形，五官清晰，人体结构正常，动作连贯自然不僵硬。

→ 适用：复古武侠混剪、港片致敬、怀旧风格短视频
→ 参考图建议：上传一张邵氏经典武侠电影截图（如《独臂刀》《大醉侠》《天涯明月刀》画面），让模型学那种高对比度、暖黄调、硬光布景的复古港片质感

怎么改：把"白色劲装剑客"换成"红衣女侠""黑衣蒙面刺客"；把"荒野客栈"换成"竹林小径""悬崖瀑布旁"；核心技巧——邵氏风的灵魂在布光和色调（侧面硬光、暖黄底色、高对比暗部），而不是打斗动作。动作仍然要慢：拔剑、收势、回眸，每一个都是定格感的"亮相"。

进阶用法：时间线分段

想在一条视频里做镜头切换？按秒分段写：

0-3秒：近景特写女生脸部，柔光照亮面部轮廓，微微闭眼
3-6秒：镜头缓慢拉远到中景，女生睁眼轻轻转头
6-10秒：全景，女生起身缓步走向窗边，阳光洒入

注意别贪多——Seedance 2.0 单次 4-15 秒，一条提示词里超过 2-3 个镜头变化，模型就容易乱套。

进阶用法：视频延长的提示词衔接

前面说过"先出 5 秒，满意再延长"。但延长段的提示词怎么写？直接复制原来的提示词？还是从头写？

衔接三原则：

1. 保留约束词——延长段必须重复原始提示词里的约束词（面部不变形、服装一致等），否则后段人物可能"变脸"
2. 接着写新动作——不要重复原始动作，写下一个动作。模型会自动从上一段的末尾接续
3. 保持风格统一——风格词、色调、镜头类型跟原始段保持一致，否则前后段画面"撞色"

示例——原始段 5 秒出片后，延长 5 秒：

原始提示词（第 1 段）：

一位穿白色连衣裙的女生站在花田里，缓慢转身面向镜头，微笑。中景，固定镜头，治愈清新，4K，面部稳定不变形，人体结构正常。

延长段提示词（第 2 段）：

女生面向镜头后，缓慢伸出右手轻触身旁的花朵，低头看花微笑，微风吹动发丝。中景，固定镜头，治愈清新，4K，面部稳定不变形，人体结构正常，保持人物样貌与服装一致。

注意看：约束词完整保留，风格/镜头一致，但动作是"转身后"的下一个动作——接续而非重复。

延长段的音频怎么办？

视频延长时，音频也需要衔接。目前 Seedance 2.0 的行为是：

• 不写音频描述：模型会自动续接环境音效，通常比较自然
• 写音频描述：延长段会按新描述生成音频，但跟前段的衔接可能不平滑（音量突变、风格跳跃）
• 最稳做法：延长段不写音频描述，让模型自动续接；如果对配乐有要求，最后用剪映统一替换整段音频

简单说：画面的衔接靠提示词控制，音频的衔接靠后期统一处理。别指望延长段的音频能完美接上——这是目前所有 AI 视频工具的共同短板。

还有几个坑，顺手提一下

除了前面的 5 条反常识，实操中还有几个容易踩的：

风格和光影打架

❌ 赛博朋克暗调 + 阳光明媚的午后
❌ 超高速运动 + 画面极度稳定
❌ 特写 + 展现宏大场景

每对搭配都是"我全都要"，模型左右为难，输出质量直线下降。写之前想一秒：这两个描述矛盾吗？

视频延长搞错时长

Seedance 2.0 支持视频延长——在现有视频后面接着生成。但注意，选的时长是"新增部分"的长度，不是总长度。你选 5 秒，是在原视频后面接 5 秒，不是把整个视频压缩到 5 秒。

音频输入 ≠ 配音

上传音频是让模型参考这段音乐的节奏、风格、音色，然后生成新的音频。它不是把你的歌直接贴到视频上。想要精确的音画同步，还是得回剪映手动对齐。

不加约束词 = 裸奔

不管什么场景，提示词末尾都要加约束词（具体写法见前面维度 8）。这几个词是安全带，不系就等着翻车。

上面说的是提前避坑。但如果已经翻车了呢？下面这张排查表帮你定位问题——

效果不好？按这个顺序排查

生成的视频不满意，先别急着重写提示词。按下面这张表从上往下逐条查，80% 的问题出在前三项：

症状	最可能的原因	怎么改
人脸变形、五官扭曲	缺约束词	末尾加"面部稳定不变形，五官清晰，人体结构正常，比例自然"
肢体变形、手指异常	动作太快或太复杂	把动作改慢：快速→缓慢，跳跃→轻轻抬脚，大幅度→微微
画面混乱、主体不清	塞了太多主体或动作	砍到"一个主体 + 一个核心动作"，多余的拆成下一条视频
风格诡异、画面违和	描述自相矛盾	检查有没有"赛博朋克 + 阳光明媚""特写 + 宏大场景"这种冲突
画面模糊、细节丢失	画质词不够 / 分辨率低	加"4K超高清，细节丰富，锐度清晰"；调试完用 2K 出正式版
跟参考图完全不像	@引用没绑对 / 引用描述不够	鼠标悬停确认素材对应关系；加"保持人物样貌与服装一致"
后半段动作偏移	视频太长	缩短到 5-6 秒先出满意的，再用"视频延长"接后段
每次生成结果差异大	提示词太短，模型靠猜	补到 80-200 字，覆盖动作+镜头+画质+约束四个必写维度

排查口诀：约束 → 动作 → 主体 → 风格 → 画质 → 引用 → 时长 → 长度。按这个顺序改，每次只改一个变量，才能定位到底哪里出了问题。一次改三处，好了也不知道是哪个起了作用。

Sora / Kling / Seedance 选谁？看你要什么

手上已经有别的工具的话，看这张表就够了：

你要什么	选什么	理由
精准控制画面（丢参考素材照做）	Seedance 2.0	唯一四模态 @引用
2K 分辨率	Seedance 2.0	截至目前行业最高
画面+音效+配乐一次出	Seedance 2.0	音画一体
最真实的物理效果	Sora 2	物理模拟能力最强
最自然的运动和皮肤质感	Kling 3.0	人物渲染领先
最好的光影艺术	Veo 3.1	光影渲染世界级
预算有限	Seedance 1.5 Pro	性价比最高

一句话：需要可控性（给参考让 AI 照做），Seedance 2.0 目前没对手。要单纯的画质美感或物理真实度，其他工具各有强项。

Seedance 2.0 vs 1.5 Pro：什么时候不用上 2.0

2.0 不是所有场景都比 1.5 Pro 好。如果你在乎积分消耗，看这张表：

场景	选 2.0	选 1.5 Pro
需要 2K 分辨率	✅	❌（最高 1080p）
需要多模态 @引用	✅	❌（不支持）
需要原生音频	✅	❌
简单的文生视频（风景、氛围）	能用但贵	✅ 够用，省积分
快速迭代测试提示词	能用但慢	✅ 更快出结果
短时长单一动作（≤5 秒）	能用	✅ 性价比更高

实操建议：调试阶段用 1.5 Pro 快速验证提示词方向，确认效果后切 2.0 出正式版。别拿 2.0 当草稿纸。

Seedance 2.0 做不到什么（已知局限）

前面零散提到了一些，这里集中汇总，避免你踩坑后才发现：

局限	说明	替代方案
不读负面提示词	写了 Negative Prompt 等于白写	翻转为正向描述（详见反常识 #1）
不支持权重语法	(masterpiece:1.5) 这种写法无效	用自然语言强调重要元素
无 Seed 值	无法通过固定 seed 复现完全一致的结果	提示词越详细，结果一致性越高
不支持 LoRA / 自定义模型	无法加载第三方风格模型	用 @引用风格参考图替代
无法精确音画卡点	原生音频不支持逐帧对齐	剪映手动对齐
无法完全静音	不写音频描述时仍可能生成环境音	后期用剪映静音
长视频后段易偏移	超过 8 秒后动作/面部稳定性下降	先出 5 秒，满意后用"视频延长"
多主体表现差	2 个以上主体容易互相干扰	一个视频一个主体，后期合成
快动作必翻车	剧烈运动导致变形	所有动作改慢（详见反常识 #2）

这些局限是截至 2026 年 2 月的情况。AI 视频工具迭代很快，部分限制可能在后续版本中改善。

批量出片工作流

做内容的人不会一次只出一条视频。如果你需要批量生产（比如一次做 10 条短视频素材），建议把 Seedance 当成「素材工厂」，用一套标准化流程来跑。

Step 0：先定一套统一的命名规则

先解决一个最容易被忽略、却最影响效率的问题：素材命名。约定一套全组通用的规则：

• 人物照片：role_角色名_编号.jpg（例：role_girl_a_01.jpg）
• 场景照片：bg_场景关键词_编号.jpg（例：bg_cafe_01.jpg）
• 运镜参考视频：cam_机位_用途_编号.mp4（例：cam_push_in_01.mp4）
• 配乐 / 音频：bgm_情绪_节奏_编号.mp3（例：bgm_chill_90bpm_01.mp3）

这样写提示词时，用 @图片1 作为人物形象 就不会怀疑自己到底绑的是哪张图。

Step 1：一次性定好「一批内容的骨架」

针对一个账号 / 一个活动，团队一起先定 3 件事：

1. 这批视频的目的：涨粉 / 带货 / 日更陪伴 / 课程预告…
2. 统一的视觉基调：日系清新 / 赛博朋克 / 写实纪录片…
3. 可以反复复用的 3–5 个场景模板：

• 比如：人物情绪特写 / 商品极致特写 / 氛围 B-roll / 城市街景穿插…

这一层确定好了，后面就只是「在同一套画面结构里换内容」，而不是每条都从零设计。

Step 2：给每个场景写一条「母版提示词」

选出 3–5 个常用场景，每个写一条「母版」——就是用本文的 8 维度公式写满、全组可以复制改词的那种。

• 母版原则：

• 主体 + 动作 + 场景 + 光影 + 镜头语言 + 风格 + 画质 + 约束至少覆盖 6 项；
• 和具体商品 / 话题强相关的词，留成【可替换槽位】。

示例（商品极致特写母版）：

【商品名称】放在画面中央，放大到几乎填满画面，表面【玻璃/金属/陶瓷】质感清晰可见，【液体/纹理】缓慢流动，形成细腻的高光和阴影。特写镜头，缓慢推近，画面稳定无抖动，4K超清，细节锐利，背景完全虚化成柔和的【主色】渐变光斑，高级极简风格，整体偏暗调，冷色调打光，哑光质感，无杂物干扰，画面干净整洁。

成员只要替换【商品名称】【玻璃/金属/陶瓷】【液体/纹理】【主色】，就能快速产出一批风格统一的素材。

Step 3：新人必须过一遍「出片前自检表」

在团队内部约定：任何人点「生成」前，必须过一遍这 6 条（可以贴在工位）：

• 这条视频里，是否只有 一个主体 + 一个核心动作？
• 提示词里有没有写「慢、缓慢、轻轻、丝滑、稳定」这类词？
• 有没有任何「不要、no、Negative、禁止」这类负面词？（有就删）
• 有没有明确的镜头描述？（近景 / 中景 / 远景 + 推 / 拉 / 横移 / 环绕 / 固定…）
• 有没有写「画面稳定无抖动 + 面部/人体不变形」这类约束？
• 如果用了 @引用：鼠标悬停检查一遍，标签是否指向了你想要的素材？

任何一条「否」，先改提示词，再生成。你会发现，团队整体出片质量会明显抬一档。

Step 4：生产节奏——3 版提示词 × 每版 2–3 条

比起一条提示词死磕、疯狂重刷，更高效的方式是：

1. 针对同一个选题，写 3 个不同风格的提示词版本（比如：治愈 / 记录感 / 暗调高级）。
2. 每个版本 先出 2–3 条，不要贪多。
3. 人肉筛一遍：

• 丢掉明显翻车的（人物崩坏 / 光影糊 / 运镜乱晃）；
• 挑出各版本里最好的一条，进剪映二次剪辑。

你要的是「一支能上的片」，不是「十支半残片」。

Step 5：调试用低配，出片用高配

把上面的流程和前文的参数建议串起来，就是一句话：

• 调试：1.5 Pro + 1080p + 5 秒，快速验证提示词方向；
• 出片：Seedance 2.0 + 2K + 目标时长，出正式版；
• 延长：对满意的视频用「视频延长」接到目标长度；
• 收尾：导入剪映，拼接 + 配音 + 字幕 + 精调音频 → 导出成片。

别拿 2.0 + 2K 当草稿纸，10 条视频全部用高配调试，积分和时间都扛不住。

💡 进阶技巧：把写好的提示词存到一个文档里当「提示词库」。下次做类似内容时直接从库里调，改几个关键词就能用，不用每次从零写。

提示词 Checklist：写完对照，10 秒钟

每次写完提示词，过一遍这个清单：

⚠️ 必查项：

• 主体明确？闭眼能想出画面？
• 动作是慢的、连续的？没写"快速""剧烈""跳跃"？
• 景别写了？特写 / 近景 / 中景 / 全景
• 运镜写了？推镜 / 拉远 / 横移 / 环绕 / 固定
• 加了"画面稳定""无抖动"？
• 画质词加了 4-6 个？4K / 高清 / 电影质感
• 角色稳定约束加了？面部不变形 / 五官清晰 / 结构正常
• 提示词在 80-200 字区间？不要太短也不要太长
• 用中文写的？没有专门翻译成英文？

💡 建议查：

• 没有自相矛盾的描述？暗调 vs 阳光明媚？
• 一个主体 + 一个核心动作？
• 没写负面提示词？没用权重语法 (xx:1.5) ？
• 用了 @引用的话，悬停确认了素材对应关系？
• 生成参数选对了？时长 / 分辨率 / 画面比例
• 图生视频的话，首帧图质量够高？（≥1024px，五官无遮挡）

前 9 项是必查项，后 6 项是建议查。前十条提示词逐项对照着写，之后就成条件反射了。

💡 建议打印：把这份 Checklist 打印出来贴在屏幕旁边（或截图保存到手机相册）。写提示词时扫一眼，10 秒钟避免 80% 的翻车。

一页纸总表：每次写 Seedance 提示词前先看一眼

核心心法（记 3 句就够）：

1. 不写负面，只写你「要什么」。
2. 动作越慢越好，一个视频只讲一件事。
3. 先上素材再说话：@图片 / @视频 / @音频是杀手锏。

出片公式（80–200 字，覆盖下面至少 6 项）：

• 主体：谁？长相 / 服装 / 年龄 / 特征…
• 动作：做什么？动作是否「慢、连、稳」？
• 场景：在哪？室内 / 室外 / 城市 / 自然 / 时间…
• 光影：明暗关系 / 光源位置 / 色温…
• 镜头语言：近景 / 中景 / 远景 + 推 / 拉 / 横移 / 环绕 / 固定…
• 风格：日系 / 纪录片 / 赛博朋克 / 商业广告…
• 画质：4K / 2K、清晰度、细节丰富…
• 约束：画面稳定无抖动、面部不变形、人体结构正常、同一角色一致…

3 步自检：

1. 提示词里是否出现了任何「不要 / Negative / no blur」？→ 有就删。
2. 是否只有 1 个主体 + 1 个核心动作？→ 否的话拆成两条视频。
3. 是否明确写了镜头和约束？→ 没写就补上再生。

用最简单的话总结这篇文章：「多给画面，少给形容词；多给素材，少给参数；多给慢动作，少给大动作。」

练一下：改写这 3 条错误提示词

读十遍不如改一遍。下面 3 条提示词各犯了不同的错，试着自己改完再看参考答案。

练习 1——犯了几条规则？

a beautiful girl dancing in the garden. Negative prompt: no blur, no ugly face, no bad anatomy

👉 点击看参考改写

犯了 3 条：① 写了负面提示词 ② 用英文（中文更好） ③ "dancing"太快太模糊。改写：

一位穿粉色纱裙的年轻女生，站在开满绣球花的花园里，缓慢抬起双臂划出优美弧线，裙摆随动作轻轻飘起。中景，固定镜头，治愈清新，4K高清，面部稳定不变形，人体结构正常，动作优雅不僵硬。

练习 2——信息量够吗？

一只猫在窗台上

👉 点击看参考改写

只有 7 个字，远低于 80 字甜区。什么猫？什么动作？什么光线？改写：

一只橘色短毛猫蹲在木质窗台上，阳光从窗外洒入照亮毛发，猫咪缓慢眯起眼睛，尾巴轻轻摆动，窗外是虚化的绿色植物。近景，固定镜头，治愈清新，暖色调，4K超高清，细节丰富，毛发质感清晰，画面稳定。

练习 3——能找出矛盾吗？

三个朋友在咖啡厅聊天，一个人在玩手机，一个在看窗外，赛博朋克暗调，阳光明媚的午后，特写镜头展现宽阔的咖啡厅全景，快速环绕运镜，4K高清，面部稳定。

👉 点击看参考改写

至少 4 个问题：① 3 个主体太多 ② "赛博朋克暗调"vs"阳光明媚"矛盾 ③ "特写"vs"全景"矛盾 ④ "快速环绕"容易翻车。改写：

一位穿深色毛衣的年轻女生，坐在咖啡厅靠窗座位，双手捧着咖啡杯，缓慢抬头看向窗外，表情若有所思。近景，镜头缓慢推近到面部，室内暖黄灯光照亮侧脸，窗外冷色自然光形成冷暖对比，韩系氛围感，4K超高清，面部稳定不变形，五官清晰，画面稳定无抖动。

三句话收尾

Seedance 2.0 的核心逻辑：

1. 给参考，别许愿——多模态 + @引用，比纯写字精准十倍
2. 动作写慢，约束写全——慢动作 + 稳定约束 = 不翻车
3. 具体化一切——每个词都要有画面，别用空洞形容词

还记得开头那个朋友吗？后来他用本文的公式重写了提示词：删掉所有负面提示词，动作全部改慢，加上约束词。同一个"人物转身"场景，第一次就出了一条他自己都不敢相信的视频——人脸稳定、动作流畅、光影自然。他说："就这么简单？"

就这么简单。

工具还在快速迭代中。但提示词的基本功不会过时——不管模型怎么升级，"说清楚你要什么"这件事永远是你能做的最有价值的操作。

你的第一个练习：打开即梦（），用模板 1（唯美人像）生成一条视频。不用改任何词，直接复制粘贴，点生成。看看效果——如果还行，试着把"淡蓝色连衣裙"换成你想要的服装，"林间小路"换成你想要的场景。这就是学会提示词最快的路径：先抄，再改，最后自己写。

第一个视频可能不完美，但第三个大概率会让你自己惊一下。

学习路径建议：先用模板出 3-5 个视频 → 理解公式各维度 → 开始自己组合写 → 尝试 @引用多模态输入。按这个顺序走，一周就能写出稳定出片的提示词。

效果不对？90% 是提示词的问题。翻出 Checklist 逐条查。

特别声明：以上内容(如有图片或视频亦包括在内)为本平台用户上传并发布，本平台仅提供信息存储服务。举报