news 2026/5/1 8:42:43

阿里发布电影级视频模型万相2.6,人人都能当电影主角

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
阿里发布电影级视频模型万相2.6,人人都能当电影主角

12月16日,阿里发布新一代万相2.6系列模型,该系列模型面向专业影视制作和图像创作场景进行了全面升级,全新的万相2.6是国内首个支持角色扮演功能的视频模型。该模型同时支持音画同步、多镜头生成及声音驱动等功能,是全球功能最全的视频生成模型。据记者了解,万相2.6已同步上线阿里云百炼、万相官网。

今年9月,阿里率先在国内发布音画同步的视频生成模型万相2.5,极大提升视频创作的效率,在权威大模型评测集LMArena上,万相图生视频位居国内第一。此次发布的万相2.6进一步提升了画质、音效、指令遵循等能力,单次视频时长实现国内最高的15s,万相2.6还新增了角色扮演和分镜控制功能,不仅能一键完成单人、多人、人与物合拍的视频,还能自动实现多镜头切换等专业任务,满足专业影视级场景需求。

万相2.6是国内首个支持角色扮演功能的模型,能参考输入视频中的角色外观和音色、实现角色扮演,按照提示词生成单人、多人、人与物合拍的视频

据介绍,通义万相在模型结构上集成了多项创新技术,可对输入参考视频进行多模态联合建模与学习,参考具有时序信息的主体情绪、姿态和多角度全面视觉特征,同时提取音色、语速等声学特征,在生成阶段作为参考条件控制,实现从画面到声音的全感官全维度一致性保持与迁移,目前万相可支持单人和多人的表演。

万相2.6可将用户简单的提示词转换为多分镜脚本,生成包含多个镜头的连贯叙事视频,并且保持多镜头间的主体、场景等关键信息的一致性

在分镜控制上,通义万相能通过高层语义理解,将原始输入构建为具备完整故事线与叙事张力的专业级多镜头段落,在多镜头丝滑切换的过程中保持核心主体、场景布局和环境氛围统一建模,确保全片在内容、节奏和氛围上的高一致性。

万相2.6的角色扮演功能让普通用户也能在影视级画面里表现精湛的演技。例如,用户上传一段个人视频,并输入一段科幻悬疑风格的提示词,万相2.6能快速完成分镜设计、角色演绎、画面配音等环节工作,生成一段镜头叙事完整、电影级运镜的短片,仅需几分钟就能帮用户圆电影主角梦。

面向广告设计、短剧制作等专业场景,通过输入连续提示词,万相还能生成一段完整叙事的短片,让人人都能当导演。例如,输入一段广告创意的提示词,万相2.6能生成一段包含人物角色和商品的广告视频,并且在多镜头切换的情况下保持主体、场景等关键信息的一致性。

即日起,所有人可直接在万相官网体验万相2.6,企业用户还能通过阿里云百炼调用模型API,据悉,千问APP也将于近期上线该模型,并提供更丰富的玩法。

目前,万相模型家族已支持文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成、角色扮演及通用视频编辑等10多种视觉创作能力,已广泛应用于AI漫剧、广告设计和短视频创作等领域。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 5:44:35

揭秘Dify集成Tesseract自定义词典全过程:5步实现精准文本识别

第一章:揭秘Dify集成Tesseract自定义词典的核心价值在OCR(光学字符识别)技术日益普及的今天,准确识别特定领域文本成为关键挑战。Tesseract作为开源OCR引擎,虽具备强大识别能力,但在专业术语、专有名词或非…

作者头像 李华
网站建设 2026/5/1 0:47:19

【企业级文档安全必看】:Dify如何破解加密PDF解析困局?

第一章:加密 PDF 解析的 Dify 进度跟踪在处理企业级文档自动化流程时,加密 PDF 文件的解析成为关键挑战之一。Dify 作为一款支持可扩展工作流的低代码平台,提供了灵活的插件机制与 API 接口,可用于构建针对受密码保护 PDF 的解析任…

作者头像 李华
网站建设 2026/4/29 20:03:39

宝塔SQL导入Navicat Premium 17数据库(常规教程)教程/测试失败 1130 - Host ‘110.240,60.40‘ is not allowed to connect to t

首先我们打开Navicat Premium 17后点击新建连接后进入该页面1.连接名称,用户名,密码,都在宝塔数据库内直接复制主机是你服务器的IP2.端口这个有些复杂,需要点击服务器的查看详情点击添加规则按照下图的内容选择来源和输入端口号33…

作者头像 李华
网站建设 2026/5/1 1:01:22

【稀缺资源】气象大数据时代的核心能力:R语言极值分布建模完全手册

第一章:气象大数据与极值分析的挑战现代气象观测系统每天产生海量数据,涵盖卫星遥感、地面站记录、雷达扫描和数值模式输出。这些数据不仅体量庞大,且具有高维度、非线性以及时空异质性等特点,为极端天气事件的识别与预测带来严峻…

作者头像 李华
网站建设 2026/5/1 6:47:44

R语言处理临床数据缺失值的7种武器(附真实病例数据代码实战)

第一章:R语言处理临床数据缺失值的7种武器(附真实病例数据代码实战)在临床数据分析中,缺失值是影响模型准确性与结果可靠性的关键因素。R语言提供了多种高效工具用于识别、分析和填补缺失数据,帮助研究者从不完整数据中…

作者头像 李华
网站建设 2026/5/1 6:46:48

【R Shiny性能飞跃秘诀】:3步实现多模态内容按需加载,节省70%内存开销

第一章:R Shiny 的多模态动态加载在现代数据应用开发中,R Shiny 通过其灵活的架构支持多种数据类型和用户交互模式的动态加载。这种多模态能力使得开发者能够在一个应用中集成文本、图像、表格、图表甚至实时流数据,并根据用户行为按需渲染内…

作者头像 李华