近日,一項與圖像生成技術相關的專利信息引起了業界的廣泛關注。據天眼查披露,該專利由北京百度網訊科技有限公司申請,具體名稱為“圖像生成模型的構建、生成方法及其相關裝置”。
該專利深入探討了圖像處理及人工智能領域的創新應用。其核心在于,通過一系列復雜的算法流程,實現圖像的高效、精準生成。具體而言,該方案首先收集大量的樣本圖像,并為之匹配相應的樣本提示詞。
接下來,這些樣本圖像會經過一個名為第一預處理網絡的處理環節,該環節能夠提取出圖像的控制條件和目標潛在空間編碼。與此同時,樣本提示詞則通過第二預處理網絡被轉換為文本向量,為后續步驟提供關鍵信息。
在獲取了上述關鍵信息后,專利提出了一種創新的訓練方法。該方法將目標潛在空間編碼、文本向量和控制條件作為輸入,送入一個待訓練的UNet網絡中。結合UNet網絡輸出的噪聲分布,進行多次迭代訓練,直至得到一個性能優越的目標UNet網絡。
最終,基于第一預處理網絡、第二預處理網絡、訓練好的目標UNet網絡以及一個解碼器,構建出一個完整的圖像生成模型。這一模型不僅能夠根據給定的提示詞生成符合要求的圖像,還在圖像處理的效率和質量上實現了顯著提升。
這一專利的公布,標志著百度在圖像處理及人工智能領域的研究又邁出了重要一步。業界普遍認為,這一創新技術有望為圖像生成、圖像編輯等領域帶來革命性的變化,推動相關產業的進一步發展。