近年來,AI寫作工具的興起讓許多人只需輕敲鍵盤,就能輕松獲得論文、說唱歌詞甚至劇本的初稿。然而,盡管這些工具效率極高,它們卻難以達到“莎士比亞式”的原創高度。據Science雜志報道,最新研究表明,AI創作的作品仍帶有顯著的模仿痕跡。
為了驗證這一觀點,科研人員開發了一種專門評估AI創造力的新方法。倫敦大學學院的計算機科學家Mirco Musolesi表示,評估創造力是一個既復雜又充滿挑戰的任務,而這種新方法在衡量語言新穎性方面表現出色。
自生成式AI和大語言模型出現以來,它們的創作能力一直備受爭議。雖然這些AI系統能夠迅速生成類似人類寫作的文字,但一些學者指出,它們并未真正創新,而只是簡單地重新排列了訓練數據中的內容。批評者甚至將其比喻為“機械鸚鵡”,只會盲目重復已知文本。
然而,量化這種創造力并非易事。科研人員通常采用兩種方法:一種是使用計算機檢測抄襲跡象,但“無抄襲”并不等同于“原創”;另一種方法是讓人類評分員評估文本的流暢性和原創性,但這種方法既主觀又耗時。
為了克服這些困難,華盛頓大學的計算機科學家Lu Ximing及其團隊開發了一款名為DJ Search的工具。這款工具不僅具有客觀性,還能捕捉到文本之間的細微差異。它從AI生成的文本中提取短語片段,并在數據庫中搜索相似內容。除了尋找完全匹配項外,它還能識別語義相近的表達。通過AI算法分析詞義,它利用嵌入向量來判斷同義詞,并計算未匹配部分在文本中的占比,以此評估AI輸出的新穎性。
研究發現,在詩歌、小說和演講等領域,人類的原創性表現明顯優于AI。具體來說,人類在詩歌創作上的原創性比AI高出80%,在小說創作上高出100%,在演講方面則高出150%。
DJ Search不僅能夠評估AI作品,還能比較人類作品的原創性。例如,它發現《饑餓游戲》的語言原創性比《暮光之城》高出35%。研究負責人Lu將AI比作DJ:“它們就像DJ混音音樂一樣拼接文本,雖然能創造出令人驚嘆的作品,但無法取代真正的作曲家。”
加州大學洛杉磯分校的計算機科學家Nanyun Violet Peng提出,未來的研究應該進一步評估整體敘事的原創性,而不僅僅局限于語言層面。她認為,這將有助于更全面地了解AI和人類在創作過程中的差異。