國產大模型DeepSeek在科技界再度掀起波瀾,于1月28日凌晨悄然發布其最新力作——Janus-Pro多模態大模型,正式涉足文本生成圖像領域。這一舉動不僅彰顯了DeepSeek在人工智能領域的深厚底蘊,更為全球AI技術競賽增添了新的看點。
在備受矚目的Geneval和DPG-Bench基準測試中,Janus-Pro-7B憑借其卓越性能,一舉超越了OpenAI的DALL-E 3、Stable Diffusion以及Emu3-Gen等業界知名模型,展現了其強大的文本到圖像生成能力。這一成就無疑為DeepSeek贏得了更多的關注與贊譽。
據DeepSeek方面介紹,Janus-Pro作為其此前發布的JanusFlow大模型的高級版本,在訓練策略、訓練數據以及模型規模等方面均進行了全面優化與升級。這些改進使得Janus-Pro在多模態理解和文本到圖像的指令跟蹤功能方面取得了顯著進步,同時大幅提升了文本到圖像生成的穩定性。
盡管目前Janus-Pro僅能處理384x384分辨率的圖像,但其緊湊的模型結構卻能實現如此高水平的性能,實屬難能可貴。這一特點使得Janus-Pro在資源受限的環境下仍能保持出色的表現,為更多應用場景提供了可能。
作為一款多模態模型,Janus-Pro的功能遠不止于文本生成圖像。它還能對圖片進行精準描述,識別地標景點,識別圖像中的文字,并能對圖片中的知識進行詳細介紹。這些功能使得Janus-Pro在圖像處理、信息檢索以及知識問答等領域具有廣泛的應用前景。
Janus-Pro采用了MIT開源協議,這意味著用戶可以無限制地將其應用于商業場景。這一舉措無疑將進一步推動Janus-Pro的普及與應用,為更多企業和個人提供強大的AI技術支持。