據(jù)報(bào)道,OpenAI將向出版商提供高達(dá)500萬(wàn)美元的新聞內(nèi)容授權(quán)費(fèi)用,以訓(xùn)練其大型語(yǔ)言模型(LLM)。據(jù)稱,蘋果公司也在進(jìn)行類似的談判。這一消息是在《紐約時(shí)報(bào)》宣布起訴OpenAI侵犯其版權(quán)一周之后發(fā)布的?!都~約時(shí)報(bào)》指控OpenAI未經(jīng)其許可使用其文章訓(xùn)練LLM。
《紐約時(shí)報(bào)》于2023年12月27日宣布起訴OpenAI侵犯版權(quán),稱后者使用了其數(shù)百萬(wàn)篇文章來(lái)訓(xùn)練其LLM。
2023年,版權(quán)所有者一直在批評(píng)人工智能開(kāi)發(fā)者使用圖像和文本數(shù)據(jù)來(lái)訓(xùn)練模型,而不考慮這些數(shù)據(jù)是否受版權(quán)保護(hù)。大部分?jǐn)?shù)據(jù)來(lái)自于從互聯(lián)網(wǎng)上胡亂抓取的信息,要么是利用專門構(gòu)建的網(wǎng)絡(luò)爬蟲(chóng)抓取的,要么是從LAION之類的開(kāi)源數(shù)據(jù)提供商獲得的,然后再進(jìn)行審核和整理。這一整理過(guò)程在多大程度上會(huì)刪除受版權(quán)保護(hù)的數(shù)據(jù)仍是未知數(shù)。
《紐約時(shí)報(bào)》起訴OpenAI侵犯版權(quán),稱其LLM是“通過(guò)復(fù)制和使用數(shù)百萬(wàn)篇《紐約時(shí)報(bào)》受版權(quán)保護(hù)的新聞文章、深度調(diào)查、觀點(diǎn)文章、評(píng)論、操作指南等內(nèi)容而構(gòu)建的”。當(dāng)時(shí),OpenAI發(fā)言人告訴《紐約時(shí)報(bào)》,OpenAI尊重“內(nèi)容創(chuàng)作者和所有者的權(quán)利,并致力于與他們合作,確保他們從人工智能技術(shù)和新的收入模式中獲益”。
OpenAI與主要媒體品牌進(jìn)行許可談判的決定被視為其避免未來(lái)類似訴訟所采用的一種方式。該人工智能實(shí)驗(yàn)室已經(jīng)與《美聯(lián)社》和媒體巨鱷阿克塞爾.施普林格(Axel Springer)達(dá)成了協(xié)議,與后者的協(xié)議將允許OpenAI的ChatGPT服務(wù)的用戶接收來(lái)自阿克塞爾.施普林格新聞網(wǎng)站的內(nèi)容摘要,并看到模型對(duì)具體問(wèn)題的回答,同時(shí)會(huì)注明相關(guān)文章來(lái)自出版商。這兩項(xiàng)交易的財(cái)務(wù)條款尚不清楚。不過(guò),據(jù)美國(guó)科技媒體《The Information》報(bào)道,OpenAI為媒體公司提供的內(nèi)容授權(quán)價(jià)格在100萬(wàn)至500萬(wàn)美元之間。與此同時(shí),據(jù)報(bào)道蘋果公司將提供更高的報(bào)酬,但同時(shí)要求對(duì)新聞內(nèi)容擁有更廣泛的使用權(quán)。
在版權(quán)侵權(quán)問(wèn)題上,OpenAI還面臨著越來(lái)越不確定的監(jiān)管環(huán)境。歐盟曾表示,如果使用受版權(quán)保護(hù)的內(nèi)容來(lái)訓(xùn)練其模型,LLM開(kāi)發(fā)者必須作出聲明。不過(guò),英國(guó)和日本等其他司法管轄區(qū)已經(jīng)宣布,他們有意允許受版權(quán)保護(hù)的數(shù)據(jù)用于訓(xùn)練商業(yè)人工智能模型(盡管磋商仍在進(jìn)行中)。與此同時(shí),包括微軟、谷歌和Adobe在內(nèi)的幾家大型科技企業(yè)已經(jīng)提出,如果客戶因使用其人工智能產(chǎn)品而面臨版權(quán)索賠,它們將對(duì)客戶進(jìn)行賠償。(編譯自techmonitor.ai)