亚洲第一福利视频,欧美黑人粗大xxxxpp,国内精品一区二区三区,国产精品久久久久影院色

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

中國(guó)移動(dòng)與南京大學(xué)聯(lián)手,打造高保真2D數(shù)字人客服新體驗(yàn)!

   發(fā)布時(shí)間:2024-12-09 13:19 作者:顧雨柔

近日,中國(guó)移動(dòng)攜手南京大學(xué)團(tuán)隊(duì),在人工智能領(lǐng)域取得了一項(xiàng)重要突破,成功研發(fā)出了一種高保真2D數(shù)字人說(shuō)話驅(qū)動(dòng)系統(tǒng)。這一創(chuàng)新旨在優(yōu)化客戶(hù)服務(wù)體驗(yàn),降低運(yùn)營(yíng)成本,并為智能客服、教育培訓(xùn)及廣告營(yíng)銷(xiāo)等多個(gè)領(lǐng)域帶來(lái)革新。

作為全球用戶(hù)規(guī)模最大的通信運(yùn)營(yíng)商,中國(guó)移動(dòng)面臨著巨大的客戶(hù)服務(wù)需求。盡管智能語(yǔ)音客服已經(jīng)廣泛應(yīng)用于日常業(yè)務(wù)中,但其提供的服務(wù)體驗(yàn)仍無(wú)法與人工客服的面對(duì)面、個(gè)性化服務(wù)相提并論。為了改善這一現(xiàn)狀,中國(guó)移動(dòng)九天視覺(jué)團(tuán)隊(duì)與南京大學(xué)邰穎團(tuán)隊(duì)攜手,共同研發(fā)了這款高保真2D數(shù)字人說(shuō)話驅(qū)動(dòng)系統(tǒng)。

該系統(tǒng)能夠根據(jù)目標(biāo)人物的照片或視頻以及任意音頻,生成與之同步的說(shuō)話視頻流。生成的數(shù)字人形象逼真,表情姿態(tài)自然,且具備較高的實(shí)時(shí)性。這一技術(shù)不僅實(shí)現(xiàn)了人物數(shù)字替身的構(gòu)建,還與語(yǔ)言大模型、音頻合成能力進(jìn)行了有機(jī)整合,為用戶(hù)提供了更為真實(shí)、自然的交互體驗(yàn)。

在技術(shù)攻堅(jiān)和方案創(chuàng)新方面,該系統(tǒng)取得了顯著的成果。首先,在實(shí)時(shí)播報(bào)口型生成技術(shù)上,該系統(tǒng)達(dá)到了學(xué)術(shù)界的領(lǐng)先水平,支持中英文數(shù)字人口型驅(qū)動(dòng),實(shí)時(shí)性能達(dá)到了30毫秒每幀。其次,通過(guò)研發(fā)二階段學(xué)習(xí)框架,系統(tǒng)將數(shù)字人說(shuō)話驅(qū)動(dòng)過(guò)程拆解為從音頻到口型系數(shù)、從口型系數(shù)到生成人像兩部分,降低了學(xué)習(xí)難度,提升了生成效果。最后,該系統(tǒng)還引入了情緒引導(dǎo)學(xué)習(xí)模塊,支持正常、微笑、驚訝、憤怒、恐懼、悲傷等七種主流情緒控制生成能力,使生成的數(shù)字人具備更加豐富的情感表達(dá)能力。

在實(shí)際應(yīng)用中,該系統(tǒng)已經(jīng)實(shí)現(xiàn)了端到端的二階段30幀每秒實(shí)時(shí)生成性能,并支持512×512人臉區(qū)域生成。同時(shí),該系統(tǒng)還具備高興、悲傷等七種主流情緒控制生成能力,為用戶(hù)帶來(lái)了更加豐富的視覺(jué)體驗(yàn)。在評(píng)測(cè)集VoxCeleb指標(biāo)方面,該技術(shù)的口型準(zhǔn)確性LMD達(dá)到了4.3,生成自然度FID達(dá)到了11.1,均表現(xiàn)出色。

據(jù)中國(guó)移動(dòng)官方介紹,這一研發(fā)成果的應(yīng)用前景廣闊。它不僅有效降低了創(chuàng)作門(mén)檻,提升了生成人物的視覺(jué)質(zhì)量,還為5G新通話、和留言小秘書(shū)等品牌業(yè)務(wù)的拓展提供了有力支持。未來(lái),隨著技術(shù)的不斷成熟和應(yīng)用場(chǎng)景的不斷拓展,這一系統(tǒng)有望為更多領(lǐng)域帶來(lái)創(chuàng)新和變革。

 
 
更多>同類(lèi)內(nèi)容
全站最新
熱門(mén)內(nèi)容
本欄最新
 
智快科技微信賬號(hào)
微信群

微信掃一掃
加微信拉群
電動(dòng)汽車(chē)群
科技數(shù)碼群