-
大模型時代“得數據者得天下”,但數據侵權如何界定?
最后更新: 2024-01-04 12:09:41(文/陳濟深 編輯/呂棟)
2023年以來,隨著生成式AI的爆火,其不僅一定程度上給用戶提供了便利,也在不斷重塑互聯網行業的競爭格局,中外諸多廠商均加入了大模型開發的戰局,也間接引發了諸多的版權糾紛。
本周,紐約時報起訴OpenAI和微軟違規收集其新聞進行訓練一事(紐約時報起訴OpenAI和微軟“不勞而獲”,要求消滅),再次將大模型開發中涉嫌違規采集數據的問題暴露在公眾視野之下。
據不完全統計,今年僅在美國加州,就已經有數十起針對大模型開發商違規使用數據的訴訟。
這些訴訟頻發的背后是目前版權法案中,存在大模型對數據極度渴求和數據供應難以迅速增長的矛盾,“先授權后使用”的現有版權法律體系并無法匹配AI時代的數據使用方式,也引發了法律監管的新問題。
大模型訓練階段究竟涉及哪些版權利用行為,這一過程可能存在哪些侵權風險?而全球監管部門面對這個問題,也給出了各自的解答。
數據為王,版權訴訟戰頻發
在大模型爆炸性發展的2023年,紐約時報起訴OpenAI和微軟只不過是貫徹全年版權訴訟大戰的一個縮影。
今年1月,圖庫網站Getty Images對AI圖像生成器研發公司Stability AI提起法律訴訟,指其非法復制和處理版權圖像作為模型訓練數據。
4月,環球音樂集團發函要求Spotify等音樂流媒體平臺切斷AI公司的訪問權限,以阻止其版權歌曲被用于訓練模型和生成音樂。
6月,國內的教培巨頭學而思也被爆出,未經授權利用合作伙伴筆神作文數據進行大模型訓練導致的紛爭。
據不完全統計,自2022年11月至2023年10月,僅美國加州北區法院便已經受理了10起,版權人起訴Stability AI、Open AI、Meta、Alphabet等AIGC研發企業未經授權,利用版權作品進行模型訓練的案件。
在被告名單上,可以看到各個互聯網巨頭均在其中,而侵權訴訟頻發的背后則是大模型企業對于數據的極度渴求。
有業內人士對觀察者網表示:“目前的大模型競爭時代下,相比算法,得數據者得天下。”
一方面,訓練數據是大模型訓練的基石和燃料,如果沒有數據,大模型的訓練就無法開展和持續。另一方面,當前技術領域的研究顯示,各家大模型在算法層區別并不大,并且具有同質化的趨勢。在此背景下,訓練數據就成了真正區分且影響大模型性能的重要因素之一。
以OpenAI的幾代GPT模型為例,訓練數據上,GPT-1預訓練數據量僅有5GB;到了GPT-2,這個數據則增加至40GB;而在GPT3模型下,OpenAI用以訓練模型的數據集數據量達到了驚人的45TB,而相比GPT3的1750億參數規模,GPT4相傳達到了100萬億規模的參數,對于數據的需求呈指數型飆升。
相比需求的爆炸性增長,對于各家大模型企業而言,自身數據和公開數據的供應顯然難以滿足這種指數型的需求,從互聯網和其他友商那“搭便車”成了行業內公開的秘密,也成為了目前版權訴訟頻發的根本原因。
為了應對“偷數據”頻發的現象,除了通過訴訟手段外,不少互聯網企業也利用了技術手段開啟防御模式。
目前,有多家處在“數據提供端”的公司對數據抓取、開源等做出了反應。比如X(原名Twitter)限制了用戶每天能查看的推文數量,幾乎使數據提供服務無法使用。馬斯克對此曾表示,這是對“數據抓取”和“系統操縱”的必要反應。
2023年4月,Reddit官方宣布將對調用其API的公司收費,原因正是OpenAI、谷歌等公司利用該平臺上的數據訓練模型。
此外,IT技術問答網站Stack Overflow也計劃向AI大模型的開發者及公司收取數據訪問費用。
標簽 AI大模型- 責任編輯: 陳濟深 
-
凈利潤“腰斬式”下滑,南航物流IPO募資數十億買飛機
2024-01-04 11:51 觀網財經-金融 -
時隔一年央行重啟PSL,釋放了什么政策信號?
2024-01-03 16:54 -
蘋果仍主導全球高端機市場,余承東稱華為要在中國“全面反攻”
2024-01-03 15:10 觀網財經-科創 -
外媒緊盯:特斯拉首次被比亞迪超越
2024-01-03 10:46 觀察者頭條 -
對這項重要資源,八部門聯合發布方案
2024-01-03 10:21 -
“愛潑斯坦案”數百份密封文件將公布,克林頓代號“無名氏36”
2024-01-01 14:37 -
長光衛星闖關科創板,經營活動凈現金流持續為負
2023-12-31 15:47 -
“大錯特錯”!阿根廷宣布不加入金磚
2023-12-30 22:49 金磚國家 -
盒馬CEO侯毅首談農業品牌化:一二三產聯動是趨勢
2023-12-30 18:56 觀網財經-互聯網 -
1個月開出12家新店,大潤發母公司高鑫零售加速多業態布局
2023-12-30 18:54 觀網財經-互聯網 -
采銷固定薪酬翻倍、業績激勵上不封頂,京東重回奔騰年代
2023-12-29 21:26 觀網財經-互聯網 -
RTX 4090被禁售后,英偉達在中國市場推出“閹割版”
2023-12-29 18:55 觀網財經-科創 -
央行:進一步提升境外來華人士的支付便利化
2023-12-29 18:31 觀網財經-金融 -
統計局最終核實2022年GDP,比初步核算數減少5483億元
2023-12-29 16:11 中國經濟 -
日企控股的硅片生產商欲登陸A股,目標估值超200億
2023-12-29 15:11 觀網財經-金融 -
招商銀行“逆向討薪”近6000萬
2023-12-29 14:59 -
外國人持證可在線開A股賬戶,頭部券商已上線相關功能
2023-12-29 14:52 股市 -
華為:預計今年收入超7000億,挑戰依然嚴峻
2023-12-29 11:06 觀網財經-科創 -
2023年人民幣對美元中間價全年累計下跌近1.7%
2023-12-29 11:06 -
“半年沒還月供了”,業主發帖:600萬買入現掛280萬沒人要
2023-12-29 09:15 觀網財經-房產
相關推薦 -
“中國在非洲真正贏得了民心,就連斯威士蘭…” 評論 20“日企抱團是絕望之舉,中國工廠效率質量都是第一” 評論 81“她下月訪華,盡管特朗普團隊表達了擔憂” 評論 46“中國有能力讓夢想照進現實,將贏得史詩般競爭” 評論 110美國政府“逃過一劫” 評論 125最新聞 Hot
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團是絕望之舉,中國工廠效率質量都是第一”
-
“中國有能力讓夢想照進現實,將贏得史詩般競爭”
-
被災民暴罵到當場破防,馬克龍發飆:你該慶幸你在法國!
-
美高校敦促國際學生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調”
-
澳大利亞來了,中國就得走人?澳總理這么回應
-
美媒感慨:基建狂魔發力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-
還在扯皮中國,“涉華條款全刪了”
-
中國“光伏OPEC”發文嚴厲質問央企,怎么回事?
-
“最后一道貿易障礙,中國解除了!”
-