互聯網的奇葩事總是能刷新人類對科技公司下限的想象力。最近,Meta(原來的Facebook)被指控做了一件最尷尬的 AI 訓練操作:用 2396 部成人電影來喂養自家的大模型。是的,你沒看錯。AI 界的巨頭,居然靠著「片庫」給模型打基礎。事情是這樣的,兩家成人內容公司 Strike 3 Holdings 和 Counterlife Media 最近在美國加州聯邦法院把 Meta 告了。指控 Meta 從 2018 年起,就通過盜版下載它們公司付費內容 2396 部用于訓練 AI 模型,其中包括視頻生成類模型 Meta Movie Gen 和大語言模型 LLaMA。重點是 Meta 不單單是自己用,還做種分享,累計分發下載超過了 10 萬次,把「互聯網精神」貫徹到位。讓人繃不住的是,兩家對 Meta 提起律師函后,后者還是沒關閉 BT 鏈接,仍然在繼續分發。(好人一生平安)按美國的版權法中的故意侵權來算,每部作品最高索賠 15 萬美元,所以總計合起來就是 3.59 億美元(約合人民幣 25 億元)。看到這可能有同學疑惑了,網上資源那么多,為啥要用成人電影訓練呢?Strike 3 Holdings在訴狀里解釋了這個問題;都是法務的話術,中譯中的意思是它們的內容很高清、整個故事富有邏輯、表情自然、人物對話連貫、場景和人物變動非常少。相較于網上良莠不齊的視頻內容,高素質的「學習資料」對于 AI 來說是最好的「黃金飼料」,特別是視頻生成類的 AI 模型。Meta 之所以敢這么干還有兩個最重要的原因:下載途徑非常好獲取以及成人內容維護版權的難度還是比較高的。不過這回 Meta 算是碰到刺頭了,Strike 3 Holdings 就是最愛維權的那個成人公司,為此還專門開發了自己的「VXN Scan」追蹤系統。從 2017 年到 2023 年,它就對這類型的侵權提起了 9500 多次訴訟,也就是說,基本每天都在打官司,并且依靠這個模式達到每年數千萬美元的「維權費」收入。目前 Meta 已經承認侵權了,不過阿紅估摸著可能會庭外調解砍砍價把「車票錢」給補了。但賠錢只是一個方面,更大的問題是形象。一個全球科技巨頭,被指控「偷偷下片訓練 AI」,就算最后能擺平這次事件,想洗白也很難。大家能想象股東大會上,投資人問扎克伯格:咱們 AI 的核心競爭力是什么?扎克伯格甩出一句:「你懂的」的場面嗎?在 2023 年 Meta 就被指控用盜版網站的書來訓練自己的大語言模型,還被自家的員工吐槽,雖然最終這件案子法院判Meta勝出,不過法院也不支持 Meta 的做法。AI 巨頭 OPEN AI 和微軟也在 2023 年被起訴盜用書籍和網站文章來訓練 AI。然后就是濃眉大眼的蘋果和 NVIDIA 也同樣被曝出無授權使用 YouTube 上的視頻進行 AI 訓練。最后還有 Google,手握 YouTube 這么大一張牌,有多少內容用來訓練 AI 咱們也不得而知。所以,AI訓練這行「先上車,后補票」幾乎都成為行業共識了。不過這次Meta被抓的現行要給同行們敲個警鐘,賠錢可能可以解決一時的麻煩,但名聲臭了,那就真的玩完了。數據來源:wired、apnews、torrentfreak,圖源網絡。
本文編輯:@ 阿紅
?本文著作權歸電手所有,未經電手許可,不得轉載使用。