近期,DeepSeek在全球范圍內(nèi)的熱度持續(xù)攀升,引發(fā)廣泛關注。上海超算計算中心攜手上海昇騰人工智能創(chuàng)新中心,成功在其依托的昇騰硬件上部署了DeepSeek大模型,這一舉措為行業(yè)市場帶來了全方位的強大支持,依托于上海市人工智能公共算力服務平臺。
在模型部署方面,DeepSeek推出了兩款重量級模型——DeepSeek-R1-Distill-Qwen-32與Janus-Pro-7B。前者專注于復雜推理任務,通過先進的蒸餾技術(shù),模型體積大幅縮減,同時保持了高質(zhì)量的推理能力。其靈活性與適用性顯著增強,能夠以更加合理的資源占用,為自然語言處理、智能推薦系統(tǒng)等應用場景提供高效、精準的服務。這款模型能夠迅速應對各類復雜任務,充分滿足了不同行業(yè)對于復雜推理的嚴苛需求。
而Janus-Pro-7B作為DeepSeek推出的前沿多模態(tài)理解和生成模型,在圖像理解與生成方面展現(xiàn)出了卓越的性能。該模型采用了獨特的獨立編碼方法,直接利用文本到圖像數(shù)據(jù)進行訓練,并引入了合成美學數(shù)據(jù),進一步提升了圖像生成的質(zhì)量。無論是從文本生成圖像,還是理解圖片并生成精準描述,Janus-Pro-7B都能表現(xiàn)出色。盡管在圖像分辨率方面存在一定的局限,但在近景、特寫等特定場景下,其優(yōu)勢尤為明顯。
在部署方式上,DeepSeek采用了區(qū)域本地化部署策略,充分利用本地服務器資源,不依賴云服務。這一舉措為企業(yè)提供了DeepSeek-R1和Janus-Pro兩款模型的接口調(diào)用服務,實現(xiàn)了開箱即用,極大地提高了企業(yè)的運營效率,并滿足了其個性化業(yè)務場景的需求。
上海市人工智能公共算力服務平臺作為貫徹落實國家戰(zhàn)略、加快實施“東數(shù)西算”工程、深化發(fā)展數(shù)字經(jīng)濟的重要舉措,由上海超級計算中心負責建設和運營。該平臺致力于為廣大科研機構(gòu)和中小企業(yè)提供具有公信力的普惠算力服務,全部采用昇騰AI軟硬件平臺,計算峰值能力高達100PFLOPS(FP16)。這一平臺的建立,為科研探索與產(chǎn)業(yè)創(chuàng)新領域提供了強大的算力底座與模型支持。