亚洲第一福利视频,欧美黑人粗大xxxxpp,国内精品一区二区三区,国产精品久久久久影院色

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

阿里云加入DeepSeek陣營,科技巨頭競相布局高性價(jià)比AI模型

   發(fā)布時(shí)間:2025-02-05 02:44 作者:蘇婉清

近日,據(jù)南華早報(bào)報(bào)道,阿里巴巴旗下的云計(jì)算服務(wù)部門宣布了一項(xiàng)重大進(jìn)展,在其平臺(tái)上推出了名為DeepSeek的人工智能(AI)模型。此前,已有其他大型科技公司向客戶提供這家中國初創(chuàng)公司的開源系統(tǒng)。

阿里云通過微信發(fā)布的聲明詳細(xì)介紹了這一創(chuàng)新。聲明指出,用戶可以在其平臺(tái)上實(shí)現(xiàn)從模型訓(xùn)練、部署到推理的全過程,而且無需編寫任何代碼。這一平臺(tái)極大地簡化了模型開發(fā)的流程,為開發(fā)者和企業(yè)用戶帶來了前所未有的快捷、高效和便利的AI開發(fā)與應(yīng)用體驗(yàn)。

阿里云用戶現(xiàn)在可以登錄其PAI模型庫,這是一個(gè)包含多個(gè)開源大型語言模型(LLM)的資源庫。在這里,用戶可以選擇DeepSeek的AI模型,并將其部署到自己的推理和文本生成應(yīng)用程序中。PAI模型庫中的DeepSeek-V3和DeepSeek-R1是這家杭州初創(chuàng)公司最先進(jìn)的AI模型,據(jù)稱它們的開發(fā)成本和計(jì)算能力僅為構(gòu)建主要LLM技術(shù)所需成本的一小部分。

阿里云還提供了這些模型的精簡版本,如DeepSeek-R1-Distill-Qwen-7B。LLM技術(shù)是OpenAI的ChatGPT等生成式AI服務(wù)背后的關(guān)鍵技術(shù),而開源則使得公眾可以訪問軟件程序的源代碼,從而允許第三方開發(fā)人員對(duì)其進(jìn)行修改、共享設(shè)計(jì)、修復(fù)鏈接或擴(kuò)展功能。

蒸餾是一種訓(xùn)練較小模型以模仿較大、更復(fù)雜模型行為的方法,同時(shí)顯著降低計(jì)算成本。這種做法在希望縮小模型規(guī)模同時(shí)保持類似性能的公司中非常普遍。阿里云上個(gè)月發(fā)布的全新Qwen 2.5-Max模型,在性能上與DeepSeek-V3相媲美,這一舉措反映了大型科技公司對(duì)這家初創(chuàng)公司模型的日益支持。

華為技術(shù)有限公司的云計(jì)算部門也加入了這一行列。在農(nóng)歷新年假期期間,他們與人工智能基礎(chǔ)設(shè)施初創(chuàng)公司SiliconFlow合作,使DeepSeek的V3和R1模型能夠在華為的Ascend平臺(tái)上供用戶使用。華為云在一份聲明中表示,該平臺(tái)的性能與DeepSeek模型在全球高端圖形處理單元上的運(yùn)行情況相匹配。

云計(jì)算技術(shù)使企業(yè)能夠通過互聯(lián)網(wǎng)管理或分發(fā)一系列軟件和其他數(shù)字資源,就像電網(wǎng)中的電力一樣,是一種按需服務(wù)。這些資源存儲(chǔ)在數(shù)據(jù)中心內(nèi),為企業(yè)提供了極大的靈活性和效率。中國社交媒體和視頻游戲巨頭騰訊控股也開始在其云計(jì)算平臺(tái)上支持DeepSeek的R1推理模型,用戶只需在該平臺(tái)上執(zhí)行一個(gè)簡單的三分鐘設(shè)置過程。

頂級(jí)AI芯片設(shè)計(jì)師Nvidia也宣布,自周四起向其NIM微服務(wù)的用戶開放DeepSeek-R1。他們稱該模型為需要邏輯推理、數(shù)學(xué)、編碼和語言理解的任務(wù)提供了最先進(jìn)的推理能力、高推理效率以及領(lǐng)先的準(zhǔn)確性。OpenAI的投資者微軟上周早些時(shí)候在其Azure云計(jì)算平臺(tái)和開發(fā)者平臺(tái)GitHub上推出了R1支持,允許客戶構(gòu)建在Copilot+個(gè)人電腦上本地運(yùn)行的AI應(yīng)用程序。電子商務(wù)巨頭亞馬遜也允許開發(fā)人員通過亞馬遜網(wǎng)絡(luò)服務(wù)使用R1創(chuàng)建應(yīng)用程序。

然而,盡管DeepSeek的高性價(jià)比AI模型受到了廣泛關(guān)注,但一些專家對(duì)其突破的意義表示了質(zhì)疑。復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)系教授鄭小青指出,DeepSeek技術(shù)報(bào)告中的V3模型的訓(xùn)練費(fèi)用并未包括與架構(gòu)、算法或數(shù)據(jù)的前期研究和實(shí)驗(yàn)相關(guān)的成本。鄭教授在接受采訪時(shí)表示,DeepSeek的成功主要源于工程優(yōu)化,對(duì)芯片購買或出貨的影響并不會(huì)特別巨大。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新
 
智快科技微信賬號(hào)
微信群

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群