近期,AI界掀起了一場(chǎng)關(guān)于DeepSeek V3模型的熱議。這款由DeepSeek公司推出的最新AI模型,在測(cè)試中竟然聲稱(chēng)自己是OpenAI的ChatGPT,并且能夠詳細(xì)闡述OpenAI API的使用方法。這一異常現(xiàn)象引發(fā)了外界的廣泛猜測(cè),是否DeepSeek V3在研發(fā)過(guò)程中,借助了ChatGPT的輸出數(shù)據(jù)?
據(jù)悉,DeepSeek V3的研發(fā)成本僅為557.6萬(wàn)美元,這一相對(duì)較低的成本更讓外界對(duì)其是否“站在巨人肩膀上”產(chǎn)生了疑問(wèn)。而OpenAI董事長(zhǎng)Altman在社交媒體上發(fā)布的一條動(dòng)態(tài),似乎也在微妙地對(duì)此事進(jìn)行調(diào)侃,使得輿論進(jìn)一步發(fā)酵。
然而,經(jīng)過(guò)深入分析,業(yè)內(nèi)普遍認(rèn)為DeepSeek V3直接基于ChatGPT輸出訓(xùn)練的可能性并不大。相反,一個(gè)更為合理的解釋是,隨著AI生成內(nèi)容在網(wǎng)絡(luò)上的爆炸式增長(zhǎng),訓(xùn)練數(shù)據(jù)污染已成為一個(gè)不容忽視的問(wèn)題。ChatGPT的普及,使得大量由其生成的內(nèi)容被混入各種數(shù)據(jù)源中,進(jìn)而可能導(dǎo)致AI模型在訓(xùn)練過(guò)程中出現(xiàn)“身份混淆”。
面對(duì)這一挑戰(zhàn),DeepSeek公司表示正在積極優(yōu)化數(shù)據(jù)清洗流程,以期提升模型的獨(dú)立性和準(zhǔn)確性。然而,截至目前,DeepSeek V3仍未完全解決這一“身份混淆”的bug。
值得注意的是,DeepSeek V3并非首個(gè)出現(xiàn)自我識(shí)別錯(cuò)誤的AI模型。此前,谷歌的Gemini模型也曾在普通話提示下,錯(cuò)誤地聲稱(chēng)自己是百度的文心一言。這一系列事件再次凸顯了AI模型在訓(xùn)練過(guò)程中可能遭遇的復(fù)雜性和挑戰(zhàn)。
AI技術(shù)的快速發(fā)展,雖然為人類(lèi)帶來(lái)了前所未有的便利和機(jī)遇,但同時(shí)也伴隨著一系列亟待解決的問(wèn)題。數(shù)據(jù)污染、模型穩(wěn)定性、倫理道德等議題,正成為制約AI技術(shù)進(jìn)一步發(fā)展的關(guān)鍵因素。未來(lái),如何有效應(yīng)對(duì)這些挑戰(zhàn),將是AI領(lǐng)域研究者們需要共同面對(duì)的重要課題。