ITBear旗下自媒體矩陣:

Meta爭(zhēng)鋒AI領(lǐng)域,為超越GPT-4,Llama 3訓(xùn)練數(shù)據(jù)引爭(zhēng)議

   時(shí)間:2025-01-15 16:52:05 來(lái)源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

近日,一場(chǎng)圍繞meta人工智能版權(quán)問(wèn)題的法律糾紛,意外揭露了這家科技巨頭在AI領(lǐng)域的雄心壯志與內(nèi)部競(jìng)爭(zhēng)態(tài)勢(shì)。在Kadrey訴meta一案中,法庭公開的meta高管及研究人員的通信記錄,為人們提供了一個(gè)窺視其AI研發(fā)內(nèi)部運(yùn)作的窗口。

據(jù)這些文件顯示,meta在打造其最新AI模型Llama 3的過(guò)程中,將超越OpenAI的GPT-4視為至關(guān)重要的目標(biāo)。meta生成式AI副總裁Ahmad Al-Dahle在2023年10月發(fā)給研究員Hugo Touvron的信息中直言不諱:“我們的目標(biāo)必須是GPT-4。我們即將擁有64,000個(gè)GPU,必須學(xué)會(huì)如何構(gòu)建前沿技術(shù),并在這場(chǎng)競(jìng)賽中勝出?!?/p>

盡管meta在開源AI模型領(lǐng)域享有盛譽(yù),但其AI團(tuán)隊(duì)顯然更加關(guān)注如何超越那些不公開模型權(quán)重的競(jìng)爭(zhēng)對(duì)手,如Anthropic和OpenAI。meta的高管和研究人員將Anthropic的Claude和OpenAI的GPT-4視為行業(yè)標(biāo)桿,并以此為努力方向。相比之下,對(duì)于法國(guó)AI初創(chuàng)公司Mistral,meta則顯得頗為不屑。Al-Dahle在消息中直言:“Mistral對(duì)我們來(lái)說(shuō)不值一提,我們應(yīng)該能做得更好。”

在這場(chǎng)AI競(jìng)賽中,meta的AI領(lǐng)導(dǎo)層展現(xiàn)出了高度的競(jìng)爭(zhēng)心態(tài)。他們多次在內(nèi)部交流中提及,在獲取訓(xùn)練Llama模型所需數(shù)據(jù)時(shí)表現(xiàn)得“非常激進(jìn)”。一位高管甚至在一封內(nèi)部郵件中透露:“Llama 3幾乎是我唯一關(guān)心的事情。”這種激進(jìn)的競(jìng)爭(zhēng)策略,雖然推動(dòng)了meta在AI領(lǐng)域的快速發(fā)展,但也為其帶來(lái)了法律問(wèn)題。

檢察官指控meta高管在匆忙推出AI模型的過(guò)程中,涉嫌使用受版權(quán)保護(hù)的書籍進(jìn)行訓(xùn)練。Touvron在一份消息中指出,用于訓(xùn)練Llama 2的數(shù)據(jù)集“質(zhì)量不佳”,并討論了如何優(yōu)化數(shù)據(jù)源以提升Llama 3的表現(xiàn)。隨后,Touvron和Al-Dahle討論了使用LibGen數(shù)據(jù)集的可能性,該數(shù)據(jù)集包含了多家出版商的受版權(quán)保護(hù)作品。Al-Dahle在消息中詢問(wèn):“我們是否有合適的數(shù)據(jù)集?有沒(méi)有什么數(shù)據(jù)是你想用卻因?yàn)槟承┯薮赖脑驘o(wú)法使用的?”

meta首席執(zhí)行官馬克·扎克伯格此前曾表示,他正致力于縮小Llama模型與OpenAI、谷歌等公司的閉源模型之間的性能差距。內(nèi)部消息顯示,meta為實(shí)現(xiàn)這一目標(biāo)承受了巨大壓力。扎克伯格在2024年7月的一封信中寫道:“今年,Llama 3已經(jīng)能夠與最先進(jìn)的模型競(jìng)爭(zhēng),并在某些領(lǐng)域處于領(lǐng)先地位。從明年開始,我們預(yù)計(jì)未來(lái)的Llama模型將成為行業(yè)中最先進(jìn)的。”

經(jīng)過(guò)不懈努力,meta在2024年4月正式發(fā)布了Llama 3。這款開源AI模型在性能上與谷歌、OpenAI和Anthropic的閉源模型不相上下,甚至超越了Mistral的開源模型。然而,meta用于訓(xùn)練模型的數(shù)據(jù)的版權(quán)狀態(tài)卻存疑。盡管扎克伯格據(jù)稱批準(zhǔn)了這些數(shù)據(jù)的使用,但多起訴訟正在對(duì)其進(jìn)行審查。

這場(chǎng)圍繞meta AI版權(quán)問(wèn)題的法律糾紛,不僅揭示了meta在AI領(lǐng)域的雄心壯志和內(nèi)部競(jìng)爭(zhēng)態(tài)勢(shì),也引發(fā)了人們對(duì)于AI發(fā)展中數(shù)據(jù)版權(quán)問(wèn)題的關(guān)注。隨著AI技術(shù)的不斷進(jìn)步和應(yīng)用領(lǐng)域的不斷拓展,如何平衡技術(shù)創(chuàng)新與版權(quán)保護(hù)之間的關(guān)系,將成為未來(lái)科技領(lǐng)域亟待解決的問(wèn)題之一。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version