階躍星辰近日正式推出了其最新的開源圖生視頻模型——Step-Video-TI2V,該模型基于30B參數的Step-Video-T2V進行訓練,并在多個方面實現了顯著的提升。Step-Video-TI2V能夠生成長達5秒、分辨率為540P的視頻,包含102幀畫面,不僅在視覺效果上表現出色,更具備兩大獨特的核心功能。
這款模型最為引人注目的特點之一是其運動幅度和鏡頭運動的可控性。用戶可以根據需要調整視頻中的運動幅度,以及鏡頭的移動方式,從而創造出更加符合個人或項目需求的視頻內容。Step-Video-TI2V還具備一定的特效生成能力,為視頻創作增添了更多可能性。
與之前的文生視頻模型Step-Video-T2V相比,Step-Video-TI2V在圖生視頻任務上進行了兩大關鍵性的優化。首先,它引入了圖像條件,這一改進大大提高了視頻內容與輸入圖像之間的一致性,使得生成的視頻更加貼合用戶的預期。其次,通過引入運動幅度控制功能,Step-Video-TI2V賦予了用戶更高的自由度,讓用戶能夠更靈活地控制視頻中的動態元素。
在數據優化方面,階躍星辰團隊也做出了不懈的努力。他們針對主體動作和鏡頭運動進行了專項的精準標注,這一舉措不僅提升了模型的訓練效率,也進一步增強了視頻的生成質量和視覺效果。通過這些細致的工作,Step-Video-TI2V得以在多個維度上實現突破,為用戶帶來更加出色的視頻創作體驗。
Step-Video-TI2V的開源特性也為其廣泛應用奠定了基礎。開發者們可以基于這款模型進行二次開發,創造出更多樣化、更具創意的視頻內容。隨著技術的不斷進步和應用的不斷拓展,Step-Video-TI2V有望在視頻創作領域發揮越來越重要的作用。