國家廣播電視總局近期宣布了一項重要進展,其下屬的廣播電視科學研究院已成功研發出一款名為廣電視聽智能體(AI Agent)的創新開發工具。該工具集成了文本、圖像、視頻及音頻等多種人工智能大模型,標志著我國在生成式人工智能技術應用方面取得了顯著突破。
據了解,廣科院在研發過程中,積極整合了包括DeepSeek、阿里通義萬相、騰訊混元以及階躍星辰在內的多個國產開源大模型,這些大模型的集成使得廣電視聽智能體在功能上更加全面和強大。
廣電視聽智能體的推出,實現了節目策劃與創作全流程的智能化。它不僅具備選題策劃、腳本創作等基礎功能,還能夠進行腳本分鏡、人物形象設計、關鍵場景生成、背景音樂創作以及人物形象驅動等高級操作。這些功能極大地提升了創作人員的效率,使他們能夠以可視化的方式快速將節目創意轉化為現實。
在實際應用方面,廣科院已經攜手虎牙公司,利用廣電視聽智能體創作了兩部作品:《天工開物:工匠精神(第一集)》和《交通安全教育宣傳片(第一季)》。這兩部作品已在虎牙直播平臺和虎牙文化公眾號上線,受到了廣大觀眾的熱烈歡迎。
廣科院表示,此次與虎牙公司的合作不僅驗證了廣電視聽智能體的實用性和高效性,更為深化生成式人工智能大模型在廣播電視和網絡視聽行業的集成應用奠定了堅實的基礎。未來,隨著技術的不斷成熟和完善,廣科院計劃以開源的方式將這款開發工具共享給全行業,以期推動我國廣播電視和網絡視聽行業的高質量發展。