潞晨科技近日震撼發布其Open-Sora 2.0版本,標志著視頻生成技術領域的重大突破。此次發布不僅包括了模型的全面開源,還涵蓋了模型權重、推理代碼以及分布式訓練的全流程細節。
Open-Sora 2.0作為一款最新開源的視頻生成模型,以驚人的效率僅使用224張GPU和20萬美元的成本,便成功訓練出具備商業級水準的110億參數大模型。據官方介紹,該模型在性能上已逼近業界知名的HunyuanVideo,甚至與300億參數的Step-Video相比也毫不遜色。
尤為根據視頻生成領域的權威評測榜單VBench的最新結果,Open-Sora自1.2版本升級至2.0后,與OpenAI的Sora閉源模型之間的性能差距實現了質的飛躍。從原先的4.52%的差距大幅縮減至如今的0.69%,幾乎達到了性能上的全面對齊。
這一顯著的性能提升,無疑為視頻生成技術的應用打開了更為廣闊的空間。無論是影視制作、動畫制作還是虛擬現實等領域,Open-Sora 2.0都將以其高效、強大的生成能力,成為推動行業發展的重要力量。