近日,一則來自海外的消息引起了廣泛關注。中國人工智能新興企業DeepSeek所打造的聊天機器人,在美國蘋果應用商店的排行榜上迅速攀升,成功超越OpenAI的ChatGPT,榮登免費應用下載榜首。
追溯至1月20日,DeepSeek發布了其全新的R1推理模型。該模型旨在攻克復雜難題,并在某些基準測試中展現出了與OpenAI的GPT-4相當的性能。R1是基于去年12月推出的V3 LLM DeepSeek構建的,DeepSeek聲稱,其性能與GPT-4及Anthropic的Claude 3.5 Sonnet不相上下,但開發成本卻不足600萬美元。相比之下,OpenAI的首席執行官Sam Altman曾表示,GPT-4的訓練成本超過1億美元。
不僅如此,DeepSeek還宣稱,訓練V3模型僅需大約2000塊Nvidia專用芯片,而訓練行業領先的模型則需要16000塊或更多芯片。這些尚未得到證實的說法,引發了開發人員和投資者對當前AI領域主流計算密集型方法的質疑。如果DeepSeek的說法屬實,那么這意味著他們的工程師在面臨旨在維護美國在AI領域主導地位的貿易限制時,展現出了非凡的創造力。
近年來,Nvidia、微軟、OpenAI和meta等科技巨頭在AI數據中心上投入了數百億美元的資金。其中,僅星際之門項目就耗資5000億美元,而據稱其中有1000億美元專門用于Nvidia。面對DeepSeek的這一新動向,投資者和分析師開始重新審視這些巨額投資的價值。在盤前交易中,Nvidia、微軟等在當前AI格局中擁有重要地位的公司股價均呈現下跌趨勢。
DeepSeek的這一突破,無疑為AI領域帶來了新的競爭格局。隨著技術的不斷進步和成本的逐步降低,未來AI行業的發展將更加充滿變數。