科大訊飛在線上隆重推出了訊飛星火4.0 Turbo的全新升級版,標志著其在人工智能領域邁出了重要一步。此次升級不僅顯著增強了數學運算、行業知識理解、圖文識別以及長文本處理等多方面的能力,還首次引入了混域知識搜索技術,直擊行業痛點,為企業帶來了前所未有的智能體驗。
科大訊飛通過與多個行業領軍企業的深度合作,使得訊飛星火4.0 Turbo在金融、油氣、能源、電力、鋼鐵及航空等關鍵領域的應用效能實現了顯著提升,綜合能力提升幅度均超過10%,充分展示了其在推動產業智能化轉型方面的巨大潛力。
在當前大模型市場趨于平緩,眾多公司減緩底座模型迭代速度的背景下,科大訊飛堅守初心,持續加大投入,訊飛星火4.0 Turbo的七大核心能力實現了全面提升。這一成果不僅彰顯了科大訊飛在AI領域的深厚積累與強大實力,更是對市場需求和行業痛點精準把握的體現。
訊飛星火4.0 Turbo的升級,充分融合了行業龍頭企業的實際需求以及超過2億C端用戶的真實反饋,使得大模型能夠處理更長的文本、理解更復雜的圖文信息,并大幅減少了幻覺問題。這一改進使得大模型在行業理解能力上邁上了新的臺階。
在數學能力方面,訊飛星火4.0 Turbo的進步尤為顯著,提升幅度達到了10.5%。這一進步不僅提升了模型在數學教育和金融分析等領域的應用能力,更為科研工作的深入提供了強有力的支持。圖文識別能力的提升也是此次升級的一大亮點,通用文檔版面分析和文字識別的準確率提高了40%,對于復雜表格結構和潦草手寫文字的識別準確率更是提升了60%。
發布會現場,科大訊飛的研究員通過生動的案例展示了訊飛星火4.0 Turbo的強大功能。在醫療領域,模型能夠準確識別體檢報告中的復雜表格和手寫文字;在法律領域,法院文書、印章手寫合同等復雜文檔也能被迅速解析。無論是學術論文中的長表格,還是企業合同中的復雜版式,訊飛星火4.0 Turbo都能輕松應對,展現出卓越的識別與處理能力。
訊飛星火4.0 Turbo的圖文識別能力不僅在國內領先,還超越了國際最優競品。模型還針對性地提升了文檔要素檢測能力,知識切分和構建的粒度更加精細、準確,有效防止了大模型幻覺問題的發生。同時,面向大規模掃描文檔解析的極速版本也同步發布,文檔理解速度提升了10倍以上,使得處理500頁項目文件的全過程僅需2分鐘即可完成。
在長文本處理方面,訊飛星火4.0 Turbo也實現了重大突破。模型采用了全新的長文本框架,并首發了句子級溯源功能。這一新框架優化了超長注意力機制,并利用大規模網頁和書籍數據進行知識關聯式合成,使得知識回復的錯誤率降低了40%,句子級知識溯源準確率達90%,甚至超越了GPT-4的表現。這一改進大幅緩解了問答搜索服務中因大模型幻覺而需要反復溯源確認的問題。
科大訊飛在發布會上還展示了訊飛星火2024年的成績單。數據顯示,科大訊飛在去年的大模型招投標中表現出色,中標數量和中標金額均位居第一,成為名副其實的“標王”。在應用類項目中,數字人與客服、知識問答與知識平臺、智能編程等應用場景表現尤為突出。特別是在中標金額方面,科大訊飛以絕對優勢領先,超過了第二名到第六名的中標金額之和,充分展示了其在市場中的強大競爭力和品牌影響力。
這份成績單的背后,是科大訊飛在多個行業的廣泛布局和深耕細作。公司在通信、金融、能源、教育、政務和醫療等領域均取得了顯著成果,主要客戶均為央國企等重量級單位。通過與客戶共同打磨近百個智能體應用,科大訊飛積累了豐富的行業經驗和數據資源。
基于圖文、長文本能力的提升和行業應用能力的積累,科大訊飛在此次發布會上還首發了混域知識搜索技術。該技術能夠實現對個人知識、企業知識、業務系統數據、精品行業數據以及互聯網信息的綜合搜索。用戶只需一次提問,即可獲得綜合搜索后的結果,大幅提升了信息搜索效率。
通過“技術+應用”的不斷正向循環,訊飛星火學習到了豐富的行業高價值知識。研發團隊通過收集大量高質量的行業數據,自制高質量數據集,不斷打磨出更加精準、高效的行業大模型。基于此,訊飛星火4.0 Turbo在金融、油氣、能源、電力、鋼鐵、航司等多個關鍵領域均取得了顯著成果,成為了“最懂行業的大模型”。