亚洲第一福利视频,欧美黑人粗大xxxxpp,国内精品一区二区三区,国产精品久久久久影院色

智快網 - 新科技與新能源行業網絡媒體

百度發布全新語音大模型,成本大降50%-90%,交互體驗再升級!

   發布時間:2025-03-31 17:15 作者:馮璃月

在今日的百度AI DAY盛會上,百度公司震撼發布了其首個基于創新互相關注意力(Cross-Attention)機制的端到端語音語言大模型。這一突破性技術不僅在電話語音問答場景中實現了超低時延與超低成本,還使得調用成本較行業平均水平顯著降低了50%至90%。

與此同時,百度旗下的文小言品牌也迎來了煥新時刻,率先接入了這一前沿模型。文小言不僅迎來了多模型融合調度、圖片問答等功能上的全面升級,更在語聊效果上實現了擬真度的飛躍。此次升級后,文小言支持重慶、廣西、河南、廣東、山東等多地特色方言,進一步拓寬了使用場景。

據百度介紹,該語音大模型在訓練和使用成本上極具優勢,推理響應速度極快,將用戶等待時長從行業常見的3-5秒縮短至約1秒,極大地提升了語音交互的流暢性。這一技術突破,無疑將為用戶帶來更加高效、便捷的語音交互體驗。

更新后的文小言還支持“多模型融合調度”功能,整合了百度自研的文心X1、文心4.5等模型,并接入了DeepSeek-R1等第三方優質模型。用戶可以根據需求選擇“自動模式”,一鍵調用最優模型組合,或者選擇特定模型完成特定任務,從而進一步提升響應速度與任務處理能力。

文小言的圖片問答功能也得到了顯著加強。用戶只需拍攝或上傳圖片,即可通過文字或語音提問,直接獲取深度解析。這一功能不僅適用于數學題目的實時解析,還能幫助用戶對比商品參數、價格,輔助購物決策。

為了滿足用戶對圖片多維解讀的需求,文小言還新增了“圖個冷知識”功能。用戶可以預設“歷史學者”、“科技達人”等人設視角,為同一圖片賦予不同維度的解讀。例如,當用戶詢問“貓為何偏愛窗邊”時,文小言能從狩獵本能、能量獲取、領地意識等多個角度給出獨特且有趣的解讀。

百度語音首席架構師賈磊在活動中透露,這是百度在業界首個推出的基于全新互相關注意力(Cross-Attention)機制的端到端語音語言大模型。他表示:“在滿足一定交互指標的前提下,該大模型的調用成本遠低于行業平均水平,推理響應速度極快,將語音交互等待時間壓縮至約1秒,極大提升了交互的流暢性和用戶體驗。同時,在大模型的加持下,我們實現了流式逐字的LLM驅動的多情感語音合成,使得語音交互更加情感飽滿、逼真且擬人化。”

 
 
更多>同類內容
全站最新
熱門內容
本欄最新
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群