近期,一場涉及meta公司的版權糾紛案引發(fā)了廣泛關注。據TechCrunch報道,原告方律師在訴訟中透露,meta首席執(zhí)行官馬克·扎克伯格曾親自批準使用盜版電子書和文章的數據集來訓練公司的Llama AI模型。
在提交給美國加州北區(qū)法院的訴訟文件中,暢銷書作家莎拉·西爾弗曼和塔-內希西·科茨等原告詳細敘述了meta公司去年晚些時候提供的證詞。這些證詞顯示,扎克伯格在明知LibGen數據集包含盜版內容的情況下,仍批準meta使用該數據集進行Llama模型的訓練。LibGen自稱是一個鏈接聚合器,但實際上提供的是包括多家知名出版商在內的盜版作品。
值得注意的是,LibGen曾多次因版權侵權被起訴、關閉,并遭受數千萬美元的罰款。然而,meta公司似乎并未因此止步。據原告律師稱,盡管meta的AI高管團隊和其他員工對使用LibGen數據集表示擔憂,但扎克伯格仍然堅持批準。meta內部員工甚至表示,他們知道這是盜版,并擔心使用這些數據集可能會削弱meta與監(jiān)管部門的談判地位。
訴訟文件還引用了一份備忘錄,指出在扎克伯格批準后,meta AI團隊“獲準使用LibGen”。這一決定顯然違背了版權法的相關規(guī)定,也損害了原創(chuàng)作者的權益。
更令人震驚的是,原告律師還揭示了meta可能試圖掩蓋其侵權行為的指控。據稱,meta工程師尼古拉·巴什利科夫為Llama團隊編寫了一個腳本,用于刪除電子書中的版權信息。meta還涉嫌從用于訓練Llama的科學期刊文章和其他數據中去除了版權標記。這一行為不僅違反了版權法,也表明meta可能有意掩蓋其侵權行為。
訴訟文件還提到,meta通過torrent方式下載了LibGen數據集。Torrent是一種網絡共享文件的方式,要求下載者同時上傳他們試圖獲取的文件。原告律師指出,meta通過torrent下載LibGen實質上構成了另一種形式的版權侵權,因為它不僅使用了盜版內容,還幫助傳播了這些盜版內容。meta還通過減少上傳的文件數量來隱瞞其侵權行為。
值得注意的是,meta生成式AI部門負責人艾哈邁德·阿爾-達赫勒批準了通過torrent下載LibGen的決定,盡管巴什利科夫對其可能“法律上不合規(guī)”表示了擔憂。這一行為進一步證明了meta在版權問題上的不負責任態(tài)度。
原告律師表示,如果meta直接購買或借閱原告的作品并未經授權訓練Llama模型,那么它將構成版權侵權。然而,meta選擇繞過合法途徑,加入非法torrent網絡,這充分證明了其侵權行為的惡意性。
此次訴訟不僅引發(fā)了公眾對meta公司版權問題的關注,也提醒了企業(yè)在使用數據和內容時必須遵守法律法規(guī),尊重原創(chuàng)作者的權益。對于meta而言,這場訴訟無疑是一次深刻的教訓,也提醒其他企業(yè)在人工智能領域的發(fā)展中,必須注重版權保護,避免類似問題的發(fā)生。
隨著人工智能技術的不斷發(fā)展,數據和內容的重要性日益凸顯。因此,企業(yè)在使用這些數據和內容時,必須嚴格遵守相關法律法規(guī),確保合法合規(guī)。只有這樣,才能推動人工智能技術的健康發(fā)展,為社會創(chuàng)造更多的價值。