即梦 Seedance 2.0 使用手册

即梦 Seedance 2.0 现在支持图像、视频、音频、文本四种模态输入，表达方式更丰富，生成也更可控。

「参考能力」是最大亮点：

📷 参考图像可精准还原画面构图、角色细节
🎥 参考视频支持镜头语言、复杂的动作节奏、创意特效的复刻
⏱ 视频支持平滑延长与衔接，可按用户提示生成连续镜头，不止生成，还能"接着拍"
✂️ 编辑能力同步增强，支持对已有视频进行角色更替、删减、增加

02

参数预览

了解支持的输入格式与限制

核心维度	Seedance 2.0 规格
图片输入 jpeg / png / webp / bmp / tiff / gif	≤ 9 张单文件 < 30 MB
视频输入 mp4 / mov	≤ 3 个，总时长 2–15 秒单文件 < 50 MB 总像素：409600–927408（480p–720p）有参考视频时生成费用略高
音频输入 mp3 / wav	≤ 3 个，总时长 ≤ 15 秒单文件 < 15 MB
文本输入	自然语言描述，无格式限制
生成时长	≤ 15 秒，可自由选择 4–15 秒
声音输出	自带音效 / 配乐
⚠️ 混合输入总上限：12 个文件。建议优先上传对画面或节奏影响最大的素材，合理分配不同模态的文件数量。

交互形式

⚠️ 注意：即梦 Seedance 2.0 支持「首尾帧」和「全能参考」入口，智能多帧和主体参考无法选中。若你只上传首帧图 + prompt，可走首尾帧入口；如需多模态（图、视频、音频、文本）组合输入，则需进入全能参考入口。

当前支持的交互方式是通过 @素材名 来指定每个图片、视频、音频的用途，例如：

@图片1 作为首帧，@视频1 参考镜头语言，@音频1 用于配乐

⚠️ 关于上传写实人脸素材的说明

由于平台合规要求，目前暂不支持上传包含写实真人脸部的素材（图片和视频均不行）。系统会自动拦截此类素材，上传后将无法生成视频内容。后续如有更新会及时在文档里更新，感谢理解～

🎬

首帧 + 视频动作 提示词中写清楚："@图1为首帧，参考@视频1的打斗动作"

⏩

延长视频 "将@视频1延长5s"，生成时长选择「新增部分」时长（延长5s就选5s）

🔀

融合多个视频 "@视频1和@视频2之间加一个场景，内容为xxx"

🎵

参考视频声音 没有音频素材？可以直接参考视频里的声音

🔄

连续动作生成 加入连续性描述："角色从跳跃直接过渡到翻滚，保持动作连贯流畅"

03

基础能力显著增强

更稳、更顺、更像真的！物理规律更合理 · 动作更自然流畅

Seedance 2.0 在基础层面显著增强，物理规律更合理、动作表现更自然流畅、指令理解更精准、风格保持更稳定，不仅能稳定完成复杂动作、连续运动等高难度生成任务，也让整体视频效果更真实、更顺滑。

Case 01 · 晾衣服

女孩在优雅的晒衣服，晒完接着在桶里拿出另一件，用力抖一抖衣服。

首帧参考

生成结果

超强真实感

Case 02 · 可乐广告

画里面的人物心虚的表情，眼睛左右看了看探出画框，快速将手伸出画框拿起可乐喝了一口……最后镜头前推画面慢慢变得纯黑背景只有顶光照耀的罐装可乐，画面最下方出现艺术感字幕："宜口可乐，不可不尝！"

首帧参考

生成结果

Case 03 · 19世纪伦敦

镜头小幅度拉远并跟随女主移动，女主走在19世纪的伦敦大街上；右边街道驶来一辆蒸汽机车，快速驶过女主身旁，风将女主的裙摆吹起，女主一脸震惊的赶忙用双手向下捂住裙摆。

首帧参考

生成结果

Case 04 · 追逐逃亡

镜头跟随黑衣男子快速逃亡，后面一群人在追，镜头转为侧面跟拍，人物惊慌撞倒路边的水果摊爬起来继续逃，人群慌乱的声音。

首帧参考

生成结果

04

多模态全面升级

视频创作进入"自由组合"时代！

支持上传文本、图片、视频、音频，都可用作参考对象
可参考任何内容的动作、特效、形式、运镜、人物、场景、声音
Seedance 2.0 = 多模态参考能力（可参考万物）+ 强创意生成 + 指令响应精准
素材多时，建议多检查各个 @对象有没有标清楚，别把图、视频、角色搞混了

2.3.1 一致性全面提升

从人脸到服装，再到字体细节，整体一致性更稳、更准。画面里人物前后长得不一样、商品细节丢了、小字模糊、场景跳变……这些问题在 2.0 中都能被解决。

Case · 回家场景

男人下班后疲惫的走在走廊，脚步变缓，最后停在家门口，脸部特写镜头，男人深呼吸，调整情绪，收起了负面情绪，变得轻松，然后特写翻找出钥匙，插入门锁，进入家里后，他的小女儿和一只宠物狗，欢快的跑过来迎接拥抱。

参考图

生成结果

⚠️ 示例内容，实际生成可能受真人脸部限制

Case · 戏曲花旦

将@视频1中的女生换成戏曲花旦，场景在一个精美的舞台上，参考@视频1的运镜和转场效果，利用镜头匹配人物的动作，极致的舞台美感，增强视觉冲击力。

参考视频

生成结果

⚠️ 示例内容，实际生成可能受真人脸部限制

Case · 一镜转场

参考@视频1的所有转场和运镜，一镜到底，画面以棋局为起始，镜头左移展示地板的黄色沙砾，镜头上移来到一个沙滩，无缝渐变转场，冲刷的海浪变成飘动的窗帘，镜头拉远展示女孩的面部特写，一镜到底。

参考视频

生成结果

Case · 磁吸蝴蝶结广告

0-2秒：快速四格闪切，红、粉、紫、豹纹四款蝴蝶结依次定格，特写缎面光泽与"chéri"品牌字样。3-6秒：特写银色磁吸扣"咔嗒"吸合，再轻轻一拉分开，展示丝滑质感。13-15秒：四款蝴蝶结并排陈列，品牌名"chéri，당신에게 즉각적인 아름다움을 선사합니다!"

参考图

生成结果

Case · 商业包包展示

对@图片2的包包进行商业化的摄像展示，包包的侧面参考@图片1，包包的表面材质参考@图片3，要求将包包的细节均有所展示，背景音恢宏大气。

图1

图2

图3

生成结果

Case · 第一人称运镜

@图片1作为画面的首帧图，第一人称视角，参考@视频1的运镜效果，上方场景参考@图片2，左边场景参考@图片3，右边场景参考@图片4。

图1

图2

图3

图4

参考视频

生成结果

Case · 古风将军对战

将@图片1的红衣女将军作为主体1，@图片2的蓝衣女将军作为主体2，参考@视频1中两个女生打戏的灵动飘逸、刚柔并济风格，制作两位女将军对战的相同动作、相同质感视频。整体画面色调偏古风氛围感，光影细腻柔和，节奏张弛有度。

图1

图2

图3（武器）

图4（武器）

参考视频

生成结果

2.3.2 高难度运镜和动作精准复刻

以前想让模型模仿电影里的走位、运镜或者复杂动作，要么写一堆细节提示词，要么干脆做不到。而现在，只需要上传一段参考视频，就可以了。

Case · 希区柯克变焦电梯

参考@图1的男人形象，他在@图2的电梯中，完全参考@视频1的所有运镜效果，主角在惊恐时希区柯克变焦，然后几个环绕镜头展示电梯内视角，电梯门打开，跟随镜头走出电梯，电梯外场景参考@图片3。

图1

图2

图3

参考视频

生成结果

⚠️ 示例内容，实际生成可能受真人脸部限制

Case · 科技感平板运镜

@图片1的平板电脑作为主体，运镜参考@视频1，推近到屏幕的特写，镜头旋转后平板反转展示全貌，屏幕中的数据流一直在变化，周围的环境逐渐变成科幻风格的数据空间。

图1

参考视频

生成结果

Case · 汽车运镜复刻

参考视频1的运镜、画面切换节奏，拿图片1的红色超跑进行复刻。

图1

参考视频

生成结果

2.3.3 创意模版 / 复杂特效精准复刻

不止能生图写故事，Seedance 2.0 还支持"照着模仿"——创意转场、广告成片、电影片段、复杂剪辑，只要你有参考图或视频，模型就能识别动作节奏、镜头语言、视觉结构，并精准复刻出来。

Case · 科幻穿梭宇宙

将@视频1的人物换成@图片1，人物带上虚拟科幻眼镜，参考@视频1的运镜，从第三人称视角变成人物的主观视角，在AI虚拟眼镜中穿梭，来到@图片2的深邃的蓝色宇宙，出现几架飞船穿梭向远方，镜头跟随飞船穿梭到@图片3的像素世界。

图1

图2

图3

图4

参考视频

生成结果

⚠️ 示例内容，实际生成可能受限

Case · 水墨太极

黑白水墨风格，@图片1的人物参考@视频1的特效和动作，上演一段水墨太极功夫。

图1

参考视频

生成结果

⚠️ 示例内容，实际生成可能受限

Case · 金色粒子片头

以黑幕开场，参考视频1的粒子特效和材质，金色鎏金材质的沙砾从画面左边飘出并向右覆盖，参考@视频1的粒子吹散效果，@图片1的字体逐渐出现在画面中心。

图1

参考视频

生成结果

2.3.4 模型的创意性 · 剧情补全能力

Case · 漫画演绎

将@图1以从左到右从上到下的顺序进行漫画演绎，保持人物说的台词与图片上的一致，分镜切换以及重点的情节演绎加入特殊音效，整体风格诙谐幽默；演绎方式参考@视频1

图1

参考视频

生成结果

Case · 童年四季治愈片头

参考@图片1的专题片的分镜头脚本，参考@图片1的分镜、景别、运镜、画面和文案，创作一段15s的关于"童年的四季"的治愈系片头。

图1

生成结果

2.3.5 视频延长

有了原视频，可以直接基于它"接着拍"，补充故事线、增加场景、延长时长，平滑衔接不违和。

Case · 驴骑摩托广告（延长15s）

延长15s视频，参考@图片1、@图片2的驴骑摩托车的形象，补充一段脑洞广告：驴骑着摩托车冲出棚栏，在沙地盘旋，最后飞越雪山，广告语"Inspire Creativity, Enrich Life"。

图1

图2

原视频

延长结果

Case · Lucky Coffee 片尾（延长15s）

将@视频1延长15秒。1-5秒：光影透过百叶窗在木桌、杯身上缓缓滑过。6-10秒：一粒咖啡豆从画面上方轻轻飘落，镜头向咖啡豆推进至画面黑屏。11-15秒：英文渐显"Lucky Coffee · Breakfast · AM 7:00-10:00"。

原视频

延长结果

Case · 小狗圆滚滚（延长10s）

延长原视频时长到10秒，大致故事线：0-5秒先呈现主体1在树边撒尿的原画面，6-8秒小狗圆滚滚的身体顺着斜坡缓慢滚动，9-10秒小狗滚到山下，身体刚好卡在一栋小木屋门处（情绪：委屈又呆萌）。

原视频

延长结果

2.3.6 音色更准，声音更真

Case · 猫狗吐槽间

在"猫狗吐槽间"里的一段吐槽对话，情感丰沛，符合脱口秀表演：喵酱（猫主持，舔毛翻眼）：「家人们谁懂啊……」旺仔（狗主持，歪头晃尾巴）：「你还好意思说我？……」

图1

生成结果

Case · 豫剧铡美案

豫剧经典桥段《铡美案》的伴奏响起，左侧黑衣包拯指着右侧红衣陈世美，咬牙切齿地唱着豫剧："刀对鞘，真凭实据你敢不招？"陈世美眼珠左右滴溜溜乱转，此时画面外传来一声豫剧旦角的念白："且慢！"

图1

生成结果

Case · 猴子奶茶店（四川口音）

@图片1的猴子走向奶茶店柜台，向@图片2的比熊服务员用四川口音点单："幺妹儿，霸王别姬有得没得？"服务员怪异地看了一眼回答："没得，美式要不要得嘛"……

图1

图2

图3

生成结果

2.3.7 镜头连贯性（一镜到底）更强

Case · 追踪跑步者

@图片1@图片2@图片3@图片4@图片5，一镜到底的追踪镜头，从街头跟随跑步者上楼梯、穿过走廊、进入屋顶，最终俯瞰城市。

图1

图2

图3

图4

图5

生成结果

Case · 谍战红衣女特工

谍战片风格，@图片1作为首帧画面，镜头正面跟拍穿着红风衣的女特工向前走，走到拐角处消失，一个戴面具的女孩在拐角处躲着恶狠狠的盯着她，最后跟随红衣女特工走进一座豪宅消失不见。全程不要切镜头，一镜到底。

图1

图2

图3

图4

生成结果

⚠️ 示例内容，实际生成可能受限

Case · 主观视角惊险过山车

@图片1@图片2@图片3@图片4@图片5，主观视角一镜到底的惊险过山车的镜头，过山车的速度越来越快。

图1

图2

图3

图4

图5

生成结果

2.3.8 视频编辑可用度高

有时候你已经有了一段视频，只是希望调整其中一小段动作、延长几秒钟，或让角色表现更贴近你的想法。现在你可以直接用已有视频作为输入，在不改变其它内容的前提下，指定片段、动作或节奏进行定向修改。

Case · 颠覆剧情（桥上推水）

颠覆@视频1里的剧情，男人眼神从温柔瞬间转为冰冷狠厉，在女主毫无防备的瞬间，猛地将女主从桥上往外推。女主坠入水中的瞬间嘶吼："你从一开始就在骗我！"男主站在桥上，脸上露出阴冷的笑容。

原视频

编辑结果

⚠️ 示例内容，实际生成可能受限

Case · 大白鲨出没

将视频1女人发型变成红色长发，图片1中的大白鲨缓缓浮出半个脑袋，在她身后。

图1

原视频

编辑结果

Case · 小猫洗澡情绪改写

将@视频1中的小猫从害怕洗澡改写为喜欢洗澡：0-5秒好奇试探；6-11秒惬意享受沐浴；12-15秒洗完澡后甩毛、舔毛的舒适画面。整体画面柔和治愈。

原视频

编辑结果

2.3.9 可进行音乐卡点

Case · 换装卡点

海报中的女生在不停的换装，服装参考@图片1@图片2的样式，手中提着@图片3的包，视频节奏参考@视频。

图1

图2

图3

图4（海报）

节奏参考

生成结果

⚠️ 示例内容，实际生成可能受限

Case · 风光场景卡点

@图片1@图片2@图片3@图片4@图片5@图片6的风光场景图，参考@视频中的画面节奏，转场间画面风格及音乐节奏进行卡点。

图1

图2

图3

图4

图5

图6

节奏参考

生成结果

2.3.10 情绪演绎更好

Case · 崩溃大叫

@图片1的女子走到镜子前，看着镜子里面的自己，姿势参考@图片2，沉思了一会突然开始崩溃大叫，抓镜子的动作崩溃大叫的情绪和表情完全参考@视频1。

图1

图2

参考视频

生成结果

Case · 油烟机广告

@图片1作为首帧画面，女人在优雅的做饭，没有烟雾，镜头快速向右边摇动，拍摄@图片2男人满头大汗面红耳赤在做饭，浓烟滚滚，镜头向左边摇动推进拍摄@图片1桌面上的油烟机，参考@图片3，油烟机在疯狂抽烟。

图1

图2

图3

生成结果

⚠️ 示例内容，实际生成可能受限

🎬 即梦 Seedance 2.0 使用手册

参数预览

交互形式

基础能力显著增强

多模态全面升级

2.3.1 一致性全面提升

2.3.2 高难度运镜和动作精准复刻

2.3.3 创意模版 / 复杂特效精准复刻

2.3.4 模型的创意性 · 剧情补全能力

2.3.5 视频延长

2.3.6 音色更准，声音更真

2.3.7 镜头连贯性（一镜到底）更强

2.3.8 视频编辑可用度高

2.3.9 可进行音乐卡点

2.3.10 情绪演绎更好