即梦 Seedance 2.0 现在支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。

「参考能力」是最大亮点:

  • 📷 参考图像可精准还原画面构图、角色细节
  • 🎥 参考视频支持镜头语言、复杂的动作节奏、创意特效的复刻
  • ⏱ 视频支持平滑延长与衔接,可按用户提示生成连续镜头,不止生成,还能"接着拍"
  • ✂️ 编辑能力同步增强,支持对已有视频进行角色更替、删减、增加
参数与交互
02

参数预览

了解支持的输入格式与限制

核心维度Seedance 2.0 规格
图片输入
jpeg / png / webp / bmp / tiff / gif
  • 9 张
  • 单文件 < 30 MB
视频输入
mp4 / mov
  • 3 个,总时长 2–15 秒
  • 单文件 < 50 MB
  • 总像素:409600–927408(480p–720p)
  • 有参考视频时生成费用略高
音频输入
mp3 / wav
  • 3 个,总时长 ≤ 15 秒
  • 单文件 < 15 MB
文本输入 自然语言描述,无格式限制
生成时长 ≤ 15 秒,可自由选择 4–15 秒
声音输出 自带音效 / 配乐
⚠️ 混合输入总上限:12 个文件。建议优先上传对画面或节奏影响最大的素材,合理分配不同模态的文件数量。

交互形式

⚠️ 注意:即梦 Seedance 2.0 支持「首尾帧」和「全能参考」入口,智能多帧和主体参考无法选中。若你只上传首帧图 + prompt,可走首尾帧入口;如需多模态(图、视频、音频、文本)组合输入,则需进入全能参考入口。

当前支持的交互方式是通过 @素材名 来指定每个图片、视频、音频的用途,例如:

@图片1 作为首帧,@视频1 参考镜头语言,@音频1 用于配乐
⚠️ 关于上传写实人脸素材的说明

由于平台合规要求,目前暂不支持上传包含写实真人脸部的素材(图片和视频均不行)。系统会自动拦截此类素材,上传后将无法生成视频内容。后续如有更新会及时在文档里更新,感谢理解~
🎬
首帧 + 视频动作 提示词中写清楚:"@图1为首帧,参考@视频1的打斗动作"
延长视频 "将@视频1延长5s",生成时长选择「新增部分」时长(延长5s就选5s)
🔀
融合多个视频 "@视频1和@视频2之间加一个场景,内容为xxx"
🎵
参考视频声音 没有音频素材?可以直接参考视频里的声音
🔄
连续动作生成 加入连续性描述:"角色从跳跃直接过渡到翻滚,保持动作连贯流畅"
能力展示 · Cases
03

基础能力显著增强

更稳、更顺、更像真的!物理规律更合理 · 动作更自然流畅

Seedance 2.0 在基础层面显著增强,物理规律更合理动作表现更自然流畅指令理解更精准风格保持更稳定,不仅能稳定完成复杂动作、连续运动等高难度生成任务,也让整体视频效果更真实、更顺滑。

Case 01 · 晾衣服
女孩在优雅的晒衣服,晒完接着在桶里拿出另一件,用力抖一抖衣服。
首帧参考 参考图
生成结果
超强真实感
Case 02 · 可乐广告
画里面的人物心虚的表情,眼睛左右看了看探出画框,快速将手伸出画框拿起可乐喝了一口……最后镜头前推画面慢慢变得纯黑背景只有顶光照耀的罐装可乐,画面最下方出现艺术感字幕:"宜口可乐,不可不尝!"
首帧参考 参考图
生成结果
Case 03 · 19世纪伦敦
镜头小幅度拉远并跟随女主移动,女主走在19世纪的伦敦大街上;右边街道驶来一辆蒸汽机车,快速驶过女主身旁,风将女主的裙摆吹起,女主一脸震惊的赶忙用双手向下捂住裙摆。
首帧参考 参考图
生成结果
Case 04 · 追逐逃亡
镜头跟随黑衣男子快速逃亡,后面一群人在追,镜头转为侧面跟拍,人物惊慌撞倒路边的水果摊爬起来继续逃,人群慌乱的声音。
首帧参考 参考图
生成结果
多模态升级
04

多模态全面升级

视频创作进入"自由组合"时代!

  • 支持上传文本、图片、视频、音频,都可用作参考对象
  • 可参考任何内容的动作、特效、形式、运镜、人物、场景、声音
  • Seedance 2.0 = 多模态参考能力(可参考万物)+ 强创意生成 + 指令响应精准
  • 素材多时,建议多检查各个 @对象有没有标清楚,别把图、视频、角色搞混了

2.3.1 一致性全面提升

从人脸到服装,再到字体细节,整体一致性更稳、更准。画面里人物前后长得不一样、商品细节丢了、小字模糊、场景跳变……这些问题在 2.0 中都能被解决。

Case · 回家场景
男人下班后疲惫的走在走廊,脚步变缓,最后停在家门口,脸部特写镜头,男人深呼吸,调整情绪,收起了负面情绪,变得轻松,然后特写翻找出钥匙,插入门锁,进入家里后,他的小女儿和一只宠物狗,欢快的跑过来迎接拥抱。
参考图
生成结果

⚠️ 示例内容,实际生成可能受真人脸部限制

Case · 戏曲花旦
将@视频1中的女生换成戏曲花旦,场景在一个精美的舞台上,参考@视频1的运镜和转场效果,利用镜头匹配人物的动作,极致的舞台美感,增强视觉冲击力。
参考视频
生成结果

⚠️ 示例内容,实际生成可能受真人脸部限制

Case · 一镜转场
参考@视频1的所有转场和运镜,一镜到底,画面以棋局为起始,镜头左移展示地板的黄色沙砾,镜头上移来到一个沙滩,无缝渐变转场,冲刷的海浪变成飘动的窗帘,镜头拉远展示女孩的面部特写,一镜到底。
参考视频
生成结果
Case · 磁吸蝴蝶结广告
0-2秒:快速四格闪切,红、粉、紫、豹纹四款蝴蝶结依次定格,特写缎面光泽与"chéri"品牌字样。3-6秒:特写银色磁吸扣"咔嗒"吸合,再轻轻一拉分开,展示丝滑质感。13-15秒:四款蝴蝶结并排陈列,品牌名"chéri,당신에게 즉각적인 아름다움을 선사합니다!"
参考图
生成结果
Case · 商业包包展示
对@图片2的包包进行商业化的摄像展示,包包的侧面参考@图片1,包包的表面材质参考@图片3,要求将包包的细节均有所展示,背景音恢宏大气。
图1
图2
图3
生成结果
Case · 第一人称运镜
@图片1作为画面的首帧图,第一人称视角,参考@视频1的运镜效果,上方场景参考@图片2,左边场景参考@图片3,右边场景参考@图片4。
图1
图2
图3
图4
参考视频
生成结果
Case · 古风将军对战
将@图片1的红衣女将军作为主体1,@图片2的蓝衣女将军作为主体2,参考@视频1中两个女生打戏的灵动飘逸、刚柔并济风格,制作两位女将军对战的相同动作、相同质感视频。整体画面色调偏古风氛围感,光影细腻柔和,节奏张弛有度。
图1
图2
图3(武器)
图4(武器)
参考视频
生成结果

2.3.2 高难度运镜和动作精准复刻

以前想让模型模仿电影里的走位、运镜或者复杂动作,要么写一堆细节提示词,要么干脆做不到。而现在,只需要上传一段参考视频,就可以了。

Case · 希区柯克变焦电梯
参考@图1的男人形象,他在@图2的电梯中,完全参考@视频1的所有运镜效果,主角在惊恐时希区柯克变焦,然后几个环绕镜头展示电梯内视角,电梯门打开,跟随镜头走出电梯,电梯外场景参考@图片3。
图1
图2
图3
参考视频
生成结果

⚠️ 示例内容,实际生成可能受真人脸部限制

Case · 科技感平板运镜
@图片1的平板电脑作为主体,运镜参考@视频1,推近到屏幕的特写,镜头旋转后平板反转展示全貌,屏幕中的数据流一直在变化,周围的环境逐渐变成科幻风格的数据空间。
图1
参考视频
生成结果
Case · 汽车运镜复刻
参考视频1的运镜、画面切换节奏,拿图片1的红色超跑进行复刻。
图1
参考视频
生成结果

2.3.3 创意模版 / 复杂特效精准复刻

不止能生图写故事,Seedance 2.0 还支持"照着模仿"——创意转场、广告成片、电影片段、复杂剪辑,只要你有参考图或视频,模型就能识别动作节奏、镜头语言、视觉结构,并精准复刻出来。

Case · 科幻穿梭宇宙
将@视频1的人物换成@图片1,人物带上虚拟科幻眼镜,参考@视频1的运镜,从第三人称视角变成人物的主观视角,在AI虚拟眼镜中穿梭,来到@图片2的深邃的蓝色宇宙,出现几架飞船穿梭向远方,镜头跟随飞船穿梭到@图片3的像素世界。
图1
图2
图3
图4
参考视频
生成结果

⚠️ 示例内容,实际生成可能受限

Case · 水墨太极
黑白水墨风格,@图片1的人物参考@视频1的特效和动作,上演一段水墨太极功夫。
图1
参考视频
生成结果

⚠️ 示例内容,实际生成可能受限

Case · 金色粒子片头
以黑幕开场,参考视频1的粒子特效和材质,金色鎏金材质的沙砾从画面左边飘出并向右覆盖,参考@视频1的粒子吹散效果,@图片1的字体逐渐出现在画面中心。
图1
参考视频
生成结果

2.3.4 模型的创意性 · 剧情补全能力

Case · 漫画演绎
将@图1以从左到右从上到下的顺序进行漫画演绎,保持人物说的台词与图片上的一致,分镜切换以及重点的情节演绎加入特殊音效,整体风格诙谐幽默;演绎方式参考@视频1
图1
参考视频
生成结果
Case · 童年四季治愈片头
参考@图片1的专题片的分镜头脚本,参考@图片1的分镜、景别、运镜、画面和文案,创作一段15s的关于"童年的四季"的治愈系片头。
图1
生成结果

2.3.5 视频延长

有了原视频,可以直接基于它"接着拍",补充故事线、增加场景、延长时长,平滑衔接不违和。

Case · 驴骑摩托广告(延长15s)
延长15s视频,参考@图片1、@图片2的驴骑摩托车的形象,补充一段脑洞广告:驴骑着摩托车冲出棚栏,在沙地盘旋,最后飞越雪山,广告语"Inspire Creativity, Enrich Life"。
图1
图2
原视频
延长结果
Case · Lucky Coffee 片尾(延长15s)
将@视频1延长15秒。1-5秒:光影透过百叶窗在木桌、杯身上缓缓滑过。6-10秒:一粒咖啡豆从画面上方轻轻飘落,镜头向咖啡豆推进至画面黑屏。11-15秒:英文渐显"Lucky Coffee · Breakfast · AM 7:00-10:00"。
原视频
延长结果
Case · 小狗圆滚滚(延长10s)
延长原视频时长到10秒,大致故事线:0-5秒先呈现主体1在树边撒尿的原画面,6-8秒小狗圆滚滚的身体顺着斜坡缓慢滚动,9-10秒小狗滚到山下,身体刚好卡在一栋小木屋门处(情绪:委屈又呆萌)。
原视频
延长结果

2.3.6 音色更准,声音更真

Case · 猫狗吐槽间
在"猫狗吐槽间"里的一段吐槽对话,情感丰沛,符合脱口秀表演:喵酱(猫主持,舔毛翻眼):「家人们谁懂啊……」旺仔(狗主持,歪头晃尾巴):「你还好意思说我?……」
图1
生成结果
Case · 豫剧铡美案
豫剧经典桥段《铡美案》的伴奏响起,左侧黑衣包拯指着右侧红衣陈世美,咬牙切齿地唱着豫剧:"刀对鞘,真凭实据你敢不招?"陈世美眼珠左右滴溜溜乱转,此时画面外传来一声豫剧旦角的念白:"且慢!"
图1
生成结果
Case · 猴子奶茶店(四川口音)
@图片1的猴子走向奶茶店柜台,向@图片2的比熊服务员用四川口音点单:"幺妹儿,霸王别姬有得没得?"服务员怪异地看了一眼回答:"没得,美式要不要得嘛"……
图1
图2
图3
生成结果

2.3.7 镜头连贯性(一镜到底)更强

Case · 追踪跑步者
@图片1@图片2@图片3@图片4@图片5,一镜到底的追踪镜头,从街头跟随跑步者上楼梯、穿过走廊、进入屋顶,最终俯瞰城市。
图1
图2
图3
图4
图5
生成结果
Case · 谍战红衣女特工
谍战片风格,@图片1作为首帧画面,镜头正面跟拍穿着红风衣的女特工向前走,走到拐角处消失,一个戴面具的女孩在拐角处躲着恶狠狠的盯着她,最后跟随红衣女特工走进一座豪宅消失不见。全程不要切镜头,一镜到底。
图1
图2
图3
图4
生成结果

⚠️ 示例内容,实际生成可能受限

Case · 主观视角惊险过山车
@图片1@图片2@图片3@图片4@图片5,主观视角一镜到底的惊险过山车的镜头,过山车的速度越来越快。
图1
图2
图3
图4
图5
生成结果

2.3.8 视频编辑可用度高

有时候你已经有了一段视频,只是希望调整其中一小段动作、延长几秒钟,或让角色表现更贴近你的想法。现在你可以直接用已有视频作为输入,在不改变其它内容的前提下,指定片段、动作或节奏进行定向修改。

Case · 颠覆剧情(桥上推水)
颠覆@视频1里的剧情,男人眼神从温柔瞬间转为冰冷狠厉,在女主毫无防备的瞬间,猛地将女主从桥上往外推。女主坠入水中的瞬间嘶吼:"你从一开始就在骗我!"男主站在桥上,脸上露出阴冷的笑容。
原视频
编辑结果

⚠️ 示例内容,实际生成可能受限

Case · 大白鲨出没
将视频1女人发型变成红色长发,图片1中的大白鲨缓缓浮出半个脑袋,在她身后。
图1
原视频
编辑结果
Case · 小猫洗澡情绪改写
将@视频1中的小猫从害怕洗澡改写为喜欢洗澡:0-5秒好奇试探;6-11秒惬意享受沐浴;12-15秒洗完澡后甩毛、舔毛的舒适画面。整体画面柔和治愈。
原视频
编辑结果

2.3.9 可进行音乐卡点

Case · 换装卡点
海报中的女生在不停的换装,服装参考@图片1@图片2的样式,手中提着@图片3的包,视频节奏参考@视频。
图1
图2
图3
图4(海报)
节奏参考
生成结果

⚠️ 示例内容,实际生成可能受限

Case · 风光场景卡点
@图片1@图片2@图片3@图片4@图片5@图片6的风光场景图,参考@视频中的画面节奏,转场间画面风格及音乐节奏进行卡点。
图1
图2
图3
图4
图5
图6
节奏参考
生成结果

2.3.10 情绪演绎更好

Case · 崩溃大叫
@图片1的女子走到镜子前,看着镜子里面的自己,姿势参考@图片2,沉思了一会突然开始崩溃大叫,抓镜子的动作崩溃大叫的情绪和表情完全参考@视频1。
图1
图2
参考视频
生成结果
Case · 油烟机广告
@图片1作为首帧画面,女人在优雅的做饭,没有烟雾,镜头快速向右边摇动,拍摄@图片2男人满头大汗面红耳赤在做饭,浓烟滚滚,镜头向左边摇动推进拍摄@图片1桌面上的油烟机,参考@图片3,油烟机在疯狂抽烟。
图1
图2
图3
生成结果

⚠️ 示例内容,实际生成可能受限