騰訊近日在AI技術領域邁出了重要一步,其混元大模型宣布正式上線了一項創新功能——文生視頻。這一功能允許用戶僅憑一句話的描述,就能自動生成相應的視頻內容。
據悉,騰訊此次開源的視頻生成大模型擁有驚人的130億參數量,是目前市場上最大的視頻開源模型。這一技術的推出,無疑為視頻創作領域帶來了全新的變革。
用戶在使用該功能時,只需輸入一段簡短的描述文字,系統即可根據輸入內容生成視頻。更令人驚喜的是,該功能支持中英文雙語輸入,且提供了多種視頻尺寸和清晰度選項,滿足用戶的不同需求。
目前,騰訊已將這一創新功能集成到了其元寶APP中。用戶只需通過AI應用中的“AI視頻”板塊,即可申請試用該功能。同時,企業客戶也可以通過騰訊云提供的服務接入該功能,目前API內測申請也已同步開放。
在實際應用中,騰訊混元視頻生成模型展現出了卓越的性能。在與國內外多個頂尖模型的評測對比中,該模型在文本視頻一致性、運動質量和畫面質量等多個維度上均取得了領先地位。特別是在人物、人造場所等復雜場景下,其表現尤為出色。
該模型生成的視頻不僅畫質超寫實,而且能夠高度符合用戶的提示詞。畫面流暢自然,不易出現變形現象。騰訊混元在處理大幅度運動畫面時,也展現出了卓越的能力。
例如,在沖浪、跳舞等場景中,該模型能夠生成非常流暢且合理的運動鏡頭。物體在畫面中的運動軌跡自然,不易出現變形現象。同時,光影反射效果也基本符合物理規律,在鏡面或照鏡子等場景中,能夠實現鏡面內外動作的一致性。
更為先進的是,騰訊混元視頻生成模型還具備自動切換鏡頭的能力。在保持畫面主角不變的情況下,該模型能夠自動切換鏡頭,為觀眾帶來更加豐富的視覺體驗。這一功能在業界中尚屬罕見。