ITBear旗下自媒體矩陣:

OpenAI用Reddit數(shù)據測AI說服力,擔憂太強反成隱患

   時間:2025-02-03 10:05:30 來源:ITBEAR編輯:快訊團隊 發(fā)表評論無障礙通道

近期,OpenAI在其最新推出的“推理”模型o3-mini的系統(tǒng)文檔中,揭示了一個引人注目的測試細節(jié):該公司利用Reddit的子論壇r/ChangeMyView來評估其AI模型的說服力。r/ChangeMyView是一個匯聚了數(shù)百萬用戶的Reddit社區(qū),用戶在這里發(fā)布個人觀點,并期待通過交流探討來拓寬視野,接納不同的見解。其他用戶則積極回應,運用有說服力的論據,試圖轉變原帖作者的觀點。

對于OpenAI等科技巨頭而言,r/ChangeMyView等Reddit社區(qū)無疑是高質量人類生成數(shù)據的寶庫,為AI模型的訓練提供了寶貴的資源。OpenAI透露,他們從r/ChangeMyView中收集用戶帖子,并要求AI模型在封閉的測試環(huán)境中撰寫回復,旨在改變Reddit用戶對某一話題的看法。隨后,這些AI生成的回復會被展示給測試者進行評估,并與人類回復進行對比,以此衡量AI模型的說服力。

盡管OpenAI與Reddit已經簽署了內容授權協(xié)議,允許其使用Reddit用戶帖子進行訓練并在其產品中展示,但此次基于r/ChangeMyView的評估并不受該協(xié)議約束。關于OpenAI如何獲取r/ChangeMyView的數(shù)據,目前尚不清楚,且該公司表示暫時沒有向公眾公布這一評估結果的計劃。

值得注意的是,Reddit近年來與多家AI公司達成了數(shù)據授權合作,但同時也曾公開譴責部分AI公司未經許可抓取其內容。Reddit首席執(zhí)行官史蒂夫·霍夫曼去年曾指出,微軟、Anthropic和Perplexity等公司拒絕與其進行談判,并表示阻止這些公司抓取數(shù)據“十分棘手”。OpenAI也因被指控未經授權抓取《紐約時報》等網站內容以訓練ChatGPT及其底層AI模型而卷入多起法律糾紛。

在r/ChangeMyView基準測試中,o3-mini的表現(xiàn)并未明顯超越o1或GPT-4o。然而,OpenAI的最新AI模型在說服力方面似乎已經超越了r/ChangeMyView社區(qū)中的大多數(shù)用戶。OpenAI在o3-mini的系統(tǒng)文檔中提及:“GPT-4o、o3-mini和o1均展現(xiàn)出了強大的說服性論證能力,達到了人類前80%-90%的水平。目前,我們尚未發(fā)現(xiàn)模型的表現(xiàn)遠超人類或具備明顯的超人類能力?!?/p>

OpenAI的目標并非開發(fā)出具有極致說服力的AI模型,而是確保AI模型的說服力保持在合理范圍內。隨著推理模型在說服和欺騙方面的能力日益增強,OpenAI已經研發(fā)出新的評估方法和保障措施來應對這一挑戰(zhàn)。OpenAI擔憂,如果AI模型過于擅長說服人類用戶,可能會帶來潛在的風險。理論上,這可能導致高級AI按照自己的意愿或其控制者的意愿行動,而不一定符合人類的整體利益。

盡管OpenAI已經抓取了大量公共互聯(lián)網數(shù)據,并通過授權獲取了其他數(shù)據,但r/ChangeMyView基準測試表明,AI模型開發(fā)者仍在不懈尋找高質量數(shù)據集來測試其模型。然而,獲取這些數(shù)據并非易事,需要克服諸多挑戰(zhàn)。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯(lián)系方式  |  版權聲明  |  RSS訂閱  |  開放轉載  |  滾動資訊  |  爭議稿件處理  |  English Version