近日,國內AI領域迎來了一項重大突破,階躍星辰公司在其官方公眾號上正式揭曉了其傾力打造的Step-1o千億參數端到端語音大模型。這一創新成果被譽為國內首個達到千億參數級別的端到端語音模型,標志著我國在語音技術領域邁出了堅實的一步。
傳統語音模型往往采用級聯處理方案,這一過程中,用戶的語音信息首先需要被轉化為文本,然后再經過二次處理轉化為語音輸出。這種處理方式不僅效率低下,而且在信息轉換過程中容易丟失包括情感在內的諸多關鍵信息,從而導致模型反應遲鈍、回答質量欠佳、智能水平有限以及情感表達刻板等問題。相比之下,Step-1o所采用的端到端語音方案則實現了語音理解和生成的一體化,極大地提升了模型的智商和情商。
Step-1o支持混合形式的輸入和輸出,無論是語音還是文本,都能輕松應對。其快速反應和隨時打斷的特性,使得用戶體驗更加流暢。更重要的是,Step-1o能夠深度理解和模仿各種聲音特征,包括音色、韻律、方言以及個性化的口語表達習慣等,為用戶帶來更加自然和真實的交互體驗。
除了具備出色的理解和模仿能力外,Step-1o還通過自學和模仿不斷提升回復質量。它既能提供解決問題的專業建議,也能作為高情緒價值的陪伴者,滿足用戶多樣化的需求。Step-1o還繼承了階躍星辰語言大模型的創作能力,進一步豐富了其應用場景和可能性。
據階躍星辰透露,Step-1o即將接入躍問App端,為用戶提供實時語音通話服務。這一舉措無疑將進一步提升躍問App的用戶體驗,同時也為Step-1o的應用推廣打開了新的窗口。