吉利汽車集團與其科技生態戰略合作伙伴階躍星辰近日共同宣布了一項重大舉措:將雙方攜手研發的階躍Step系列多模態大模型向全球開發者全面開源。此次開源的兩大模型,不僅在技術上實現了突破,更標志著中國在AI大模型領域向全球開源社區貢獻的重要力量。
其中,階躍Step-Video-T2V作為目前全球參數量最大、性能最優的開源視頻生成模型,其參數量高達300億。該模型能夠直接生成204幀、分辨率為540P的高質量視頻,這一技術成就無疑為視頻生成領域樹立了新的標桿。據階躍星辰透露,經過嚴格的測評,Step-Video-T2V在各項性能指標上均表現出色,充分證明了其在開源視頻生成大模型中的領先地位。
另一款開源模型階躍Step-Audio,則是行業內首個達到產品級標準的開源語音交互大模型。它能夠根據場景需求靈活調整情緒、方言、語種、歌聲以及個性化風格,實現與用戶的高質量自然對話。Step-Audio生成的語音不僅具有超自然的音質,還展現出高情商的對話能力,同時支持高質量的音色復刻。用戶現在即可通過階躍星辰推出的躍問App體驗這一創新功能。
在階躍Step系列大模型的研發過程中,吉利汽車集團與階躍星辰展開了深入的合作。雙方在算力算法、場景訓練等領域實現了優勢互補,共同推動了多模態大模型性能的大幅提升。階躍星辰表示,此次開源的初衷是希望與全球開發者共享最新的多模態大模型技術成果,共同推動AI技術的發展。
階躍星辰,這家成立于2023年的人工智能大模型公司,總部位于中國上海。由前微軟全球副總裁姜大昕創辦,階躍星辰自成立以來便專注于AI大模型的研發和應用。在2024年3月,階躍星辰成功發布了Step系列大模型,并在此基礎上推出了兩款AI應用產品:躍問和冒泡鴨。這些產品的推出,不僅豐富了階躍星辰的產品線,也進一步展示了其在AI技術領域的創新實力。