本報訊 (記者梁傲男)12月16日,阿里發布新一代萬相2.6系列模型,該系列模型面向專業影視制作和圖像創作場景進行了全面升級,全新的萬相2.6是國內首個支持角色扮演功能的視頻模型。該模型同時支持音畫同步、多鏡頭生成及聲音驅動等功能,是全球功能最全的視頻生成模型。據記者了解,萬相2.6已同步上線阿里云百煉、萬相官網。
今年9月,阿里率先在國內發布音畫同步的視頻生成模型萬相2.5,極大提升視頻創作的效率,在權威大模型評測集LMArena上,萬相圖生視頻位居國內第一。此次發布的萬相2.6進一步提升了畫質、音效、指令遵循等能力,單次視頻時長實現國內最高的15s,萬相2.6還新增了角色扮演和分鏡控制功能,不僅能一鍵完成單人、多人、人與物合拍的視頻,還能自動實現多鏡頭切換等專業任務,滿足專業影視級場景需求。
據介紹,通義萬相在模型結構上集成了多項創新技術,可對輸入參考視頻進行多模態聯合建模與學習,參考具有時序信息的主體情緒、姿態和多角度全面視覺特征,同時提取音色、語速等聲學特征,在生成階段作為參考條件控制,實現從畫面到聲音的全感官全維度一致性保持與遷移,目前萬相可支持單人和多人的表演。
在分鏡控制上,通義萬相能通過高層語義理解,將原始輸入構建為具備完整故事線與敘事張力的專業級多鏡頭段落,在多鏡頭絲滑切換的過程中保持核心主體、場景布局和環境氛圍統一建模,確保全片在內容、節奏和氛圍上的高一致性。
萬相2.6的角色扮演功能讓普通用戶也能在影視級畫面里表現精湛的演技。例如,用戶上傳一段個人視頻,并輸入一段科幻懸疑風格的提示詞,萬相2.6能快速完成分鏡設計、角色演繹、畫面配音等環節工作,生成一段鏡頭敘事完整、電影級運鏡的短片,僅需幾分鐘就能幫用戶圓電影主角夢。
即日起,所有人可直接在萬相官網體驗萬相2.6,企業用戶還能通過阿里云百煉調用模型API,據悉,千問APP也將于近期上線該模型,并提供更豐富的玩法。
目前,萬相模型家族已支持文生圖、圖像編輯、文生視頻、圖生視頻、人聲生視頻、動作生成、角色扮演及通用視頻編輯等10多種視覺創作能力,已廣泛應用于AI漫劇、廣告設計和短視頻創作等領域。
(編輯 郭之宸)
| 19:13 | 航天智裝:宇航級存儲芯片業務已經... |
| 19:13 | 南極光:目前公司產品訂單充足,供... |
| 19:13 | 協鑫能科:公司高度重視以企業價值... |
| 19:13 | 八億時空:公司主營業務產品為混合... |
| 19:11 | 國家市場監督管理總局將啟動“人工... |
| 19:11 | 濤濤車業擬1500萬美元收購境外標的... |
| 19:10 | 應用場景不斷拓寬 志特新材與中國... |
| 19:10 | 車百會理事長張永偉:中國汽車產業... |
| 18:59 | 熙菱信息:截至2025年12月10日收市... |
| 18:59 | 宜通世紀:目前公司暫未涉及FSD(... |
| 18:59 | 跨境通:公司高度關注自身市值表現 |
| 18:59 | 中成股份:截至2025年12月10日公司... |
版權所有《證券日報》社有限責任公司
互聯網新聞信息服務許可證 10120240020增值電信業務經營許可證 京B2-20250455
京公網安備 11010602201377號京ICP備19002521號
證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網站電話:010-83251800 網站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關注
掃一掃,加關注