字節(jié)跳動近日正式推出了其最新的豆包大模型1.5 Pro版本,這一消息引起了業(yè)界的廣泛關(guān)注。據(jù)悉,該模型在知識、代碼、推理以及中文等多個關(guān)鍵測評領(lǐng)域,均展現(xiàn)出了超越GPT-4o、Claude 3.5 Sonnet等競爭對手的實(shí)力。
目前,豆包大模型1.5 Pro已在豆包App中開始灰度測試,與此同時,開發(fā)者也可以通過火山引擎直接調(diào)用其API接口,這為更多應(yīng)用場景的開發(fā)提供了便利。
豆包大模型1.5 Pro之所以能夠在性能上取得如此顯著的突破,得益于其采用了創(chuàng)新的預(yù)訓(xùn)練方法和大規(guī)模稀疏MoE架構(gòu)。字節(jié)跳動官方透露,該模型使用了較小的激活參數(shù)進(jìn)行預(yù)訓(xùn)練,卻能夠等效于7倍激活參數(shù)的Dense模型性能,這一效率遠(yuǎn)超業(yè)內(nèi)MoE架構(gòu)的常規(guī)水平。
除了豆包大模型1.5 Pro之外,字節(jié)跳動還同時發(fā)布了新版豆包視覺理解模型Doubao-1.5-vision-pro和豆包實(shí)時語音模型Doubao-1.5-realtime-voice-pro。其中,Doubao-1.5-vision-pro在多模態(tài)數(shù)據(jù)合成、動態(tài)分辨率、多模態(tài)對齊以及混合訓(xùn)練等方面進(jìn)行了全面升級,進(jìn)一步提升了其在視覺推理、文字文檔識別、細(xì)粒度信息理解以及指令遵循等方面的能力。
豆包實(shí)時語音模型Doubao-1.5-realtime-voice-pro已經(jīng)實(shí)現(xiàn)了端到端的語音對話功能,具備低時延、對話中可隨時打斷等特性,這一創(chuàng)新使得用戶體驗(yàn)得到了顯著提升。目前,該模型已在豆包App中全量開放,用戶只需將豆包App升級至7.2.0版本即可體驗(yàn)。
另外,字節(jié)跳動官方還表示,豆包大模型1.5 Pro及其全系列產(chǎn)品,包括Doubao-1.5-pro、Doubao-1.5-lite以及Doubao-1.5-vision-pro等,在訓(xùn)練過程中均未使用任何其他模型生成的數(shù)據(jù),這保證了模型的獨(dú)立性和原創(chuàng)性。
更令人驚喜的是,盡管豆包大模型1.5 Pro在性能和功能上都有了顯著提升,但其價格卻保持不變,真正做到了“加量不加價”。這一舉措無疑將進(jìn)一步提升豆包大模型的市場競爭力,為更多用戶帶來更加優(yōu)質(zhì)、高效的智能服務(wù)體驗(yàn)。