阿里云團隊近期公布了一項重大進(jìn)展,正式向公眾開源了其最新的推理模型——通義千問 QwQ-32B。緊隨其后,摩爾線程智能科技(北京)股份有限公司迅速宣布,在該模型發(fā)布后不久,便成功實現(xiàn)了對其的支持。
摩爾線程官方詳細(xì)介紹稱,他們利用自主研發(fā)的大語言模型高速推理框架 vLLM 和 MT Transformer 推理引擎,成功部署了 QwQ-32B。在實際應(yīng)用中,該模型展現(xiàn)出了出色的推理性能和高度穩(wěn)定性。這一成果不僅彰顯了摩爾線程在 AI 模型支持方面的技術(shù)實力,也進(jìn)一步驗證了其 MUSA 架構(gòu)和全功能 GPU 在生態(tài)兼容與快速響應(yīng)方面的獨特優(yōu)勢。
為了讓更多用戶能夠體驗到這一先進(jìn)技術(shù),摩爾線程將 QwQ-32B 模型開放上線至其模型廣場“夸娥工場”。用戶只需訪問指定網(wǎng)址,即可輕松體驗這一高性能推理模型。這一舉措無疑將極大地推動 AI 技術(shù)在更多領(lǐng)域的應(yīng)用和發(fā)展。
據(jù)摩爾線程官方提供的體驗地址顯示,夸娥工場體驗地址為:https://playground.mthreads.com,而 QwQ-32B 的專屬體驗地址則為:https://playground.mthreads.com:12019。通過這些平臺,用戶可以深入了解并體驗 QwQ-32B 模型的強大功能。
早前,阿里云通義千問官方曾透露,QwQ-32B 是一款擁有 320 億參數(shù)的推理模型。盡管其參數(shù)量相對較少,但其性能卻足以與擁有 6710 億參數(shù)(其中 370 億被激活)的 DeepSeek-R1 相媲美。這一數(shù)據(jù)無疑令人驚嘆,也進(jìn)一步證明了阿里云在 AI 技術(shù)領(lǐng)域的深厚積累和創(chuàng)新能力。
隨著 QwQ-32B 模型的開源和摩爾線程的快速支持,我們有理由相信,這一高性能推理模型將在未來在更多領(lǐng)域發(fā)揮重要作用,推動 AI 技術(shù)的不斷發(fā)展和創(chuàng)新。