近日,NVIDIA悄然推出了一款名為Nemotron-70B的AI模型,該模型在多個基準測試中表現(xiàn)出色,超越了包括OpenAI的GPT-4和Anthropic的Claude 3.5 Sonnet在內(nèi)的140多個開閉源模型,其性能僅次于OpenAI的最新模型o1。
AI社區(qū)對此反應(yīng)熱烈,紛紛驚嘆新的開源王者是否已經(jīng)到來。業(yè)內(nèi)人士更是高度評價,認為用Llama 3.1訓出的小模型能超越GPT-4o,實屬神來之筆。
Nemotron-70B基于Llama-3.1-70B開發(fā),它能夠在沒有專門提示和額外推理token的情況下,正確回答復雜的推理問題,例如“草莓有幾個r”的經(jīng)典難題。
業(yè)內(nèi)人士指出,NVIDIA在Llama 3.1基礎(chǔ)上訓練出的這個相對不大的模型,能夠超越GPT-4o和Claude 3.5 Sonnet,這標志著一次技術(shù)上的重大飛躍。
目前,Llama-3.1-Nemotron-70B-Instruct已經(jīng)可以在線體驗,為用戶提供了直接感受這款強大模型的機會。
除了推出Nemotron-70B模型,英偉達還開源了用于訓練該模型的數(shù)據(jù)集HelpSteer2。該數(shù)據(jù)集包含21362個提示響應(yīng),旨在使模型更符合人類偏好,同時也更有幫助、更符合事實、更連貫。該數(shù)據(jù)集還包含20324個用于訓練的提示響應(yīng)和1038個用于驗證的提示響應(yīng)。