滾動資訊

OpenAI用Reddit數(shù)據測AI說服力，擔憂太強反成隱患

時間：2025-02-03 10:05:30 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

近期，OpenAI在其最新推出的“推理”模型o3-mini的系統(tǒng)文檔中，揭示了一個引人注目的測試細節(jié)：該公司利用Reddit的子論壇r/ChangeMyView來評估其AI模型的說服力。r/ChangeMyView是一個匯聚了數(shù)百萬用戶的Reddit社區(qū)，用戶在這里發(fā)布個人觀點，并期待通過交流探討來拓寬視野，接納不同的見解。其他用戶則積極回應，運用有說服力的論據，試圖轉變原帖作者的觀點。

對于OpenAI等科技巨頭而言，r/ChangeMyView等Reddit社區(qū)無疑是高質量人類生成數(shù)據的寶庫，為AI模型的訓練提供了寶貴的資源。OpenAI透露，他們從r/ChangeMyView中收集用戶帖子，并要求AI模型在封閉的測試環(huán)境中撰寫回復，旨在改變Reddit用戶對某一話題的看法。隨后，這些AI生成的回復會被展示給測試者進行評估，并與人類回復進行對比，以此衡量AI模型的說服力。

盡管OpenAI與Reddit已經簽署了內容授權協(xié)議，允許其使用Reddit用戶帖子進行訓練并在其產品中展示，但此次基于r/ChangeMyView的評估并不受該協(xié)議約束。關于OpenAI如何獲取r/ChangeMyView的數(shù)據，目前尚不清楚，且該公司表示暫時沒有向公眾公布這一評估結果的計劃。

值得注意的是，Reddit近年來與多家AI公司達成了數(shù)據授權合作，但同時也曾公開譴責部分AI公司未經許可抓取其內容。Reddit首席執(zhí)行官史蒂夫·霍夫曼去年曾指出，微軟、Anthropic和Perplexity等公司拒絕與其進行談判，并表示阻止這些公司抓取數(shù)據“十分棘手”。OpenAI也因被指控未經授權抓取《紐約時報》等網站內容以訓練ChatGPT及其底層AI模型而卷入多起法律糾紛。

在r/ChangeMyView基準測試中，o3-mini的表現(xiàn)并未明顯超越o1或GPT-4o。然而，OpenAI的最新AI模型在說服力方面似乎已經超越了r/ChangeMyView社區(qū)中的大多數(shù)用戶。OpenAI在o3-mini的系統(tǒng)文檔中提及：“GPT-4o、o3-mini和o1均展現(xiàn)出了強大的說服性論證能力，達到了人類前80%-90%的水平。目前，我們尚未發(fā)現(xiàn)模型的表現(xiàn)遠超人類或具備明顯的超人類能力?！?/p>

OpenAI的目標并非開發(fā)出具有極致說服力的AI模型，而是確保AI模型的說服力保持在合理范圍內。隨著推理模型在說服和欺騙方面的能力日益增強，OpenAI已經研發(fā)出新的評估方法和保障措施來應對這一挑戰(zhàn)。OpenAI擔憂，如果AI模型過于擅長說服人類用戶，可能會帶來潛在的風險。理論上，這可能導致高級AI按照自己的意愿或其控制者的意愿行動，而不一定符合人類的整體利益。

盡管OpenAI已經抓取了大量公共互聯(lián)網數(shù)據，并通過授權獲取了其他數(shù)據，但r/ChangeMyView基準測試表明，AI模型開發(fā)者仍在不懈尋找高質量數(shù)據集來測試其模型。然而，獲取這些數(shù)據并非易事，需要克服諸多挑戰(zhàn)。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

費城墜機事故駕駛艙語音記錄器尋獲，事故原因調查進行中

02-03

U型水上機器人顯神威！海南萬寧藍天救援隊成功營救3名遇險者

02-03

《大魚海棠2》先導預告來襲！十二年匠心續(xù)作，新旅程即將啟程？

02-03

全國鐵路迎返程高峰，今日預計發(fā)送旅客1450萬人次，雨雪天如何順利返程？

02-03

萬寧藍天救援隊：水上機器人顯神威，三名游客成功獲救！

02-03

Intel Nova Lake處理器陣容曝光，頂級版本或達48核心？

02-03

ChatGPT流量下滑，DeepSeek用戶活躍度持續(xù)上升但仍落后

三言科技2月3日消息，據CNBC報道，根據在線分析平臺Semrush的數(shù)據，DeepSeek在用戶活躍度方面仍然遠遠落后于ChatGPT，OpenAI應用程序的日均訪問量保持在數(shù)千萬。但ChatGPT最近…

02-03

金價飆升！春節(jié)金飾突破847元每克，牛市通道還能走多遠？

02-03

Intel Nova Lake-SK曝光：下代桌面CPU將搭載16大核32小核？

02-03

中國紅客聯(lián)盟嚴正聲明：與DeepSeek事件無任何關聯(lián)

02-03

嫦娥七號探月新使命：2026年南極尋水冰，科研站建設加速中！

02-03

DeepSeek美國訪問量激增，ChatGPT流量下滑，AI競爭格局生變？

02-03

中國紅客聯(lián)盟正式聲明：與DeepSeek事件無關，呼吁公眾理性對待

02-03

2月2日短劇熱度揭曉：《好孕攻略》領跑，大盤熱度值突破6300萬

02-03

于冬硬氣回應：蛟龍行動絕不撤檔，怒斥黑水惡意一星評價

在沖上熱搜后，對于冬的發(fā)聲其實也是褒貶不一的，認為打“一星”的不光《蛟龍行動》一部電影。所以，這也解釋了為什么《蛟龍行動》會選擇在今年春節(jié)檔上映。那么關于為什么《蛟龍行動》在今年春節(jié)檔“掉隊”，其實于冬…

02-03

點擊查看更多 +

全站最新

U型水上機器人顯神威！海南萬寧藍天救援隊成功營救3名遇險者

《大魚海棠2》先導預告來襲！十二年匠心續(xù)作，新旅程即將啟程？

蘋果Powerbeats Pro 2來襲：主動降噪+心率監(jiān)測，運動耳機新升級！

蘋果新動向：即將上線“Confetti”活動邀請服務，或將改變聚會組織方式

九州風神CH690海景機箱震撼上市，699元起售，高性能玩家的新選擇！

《刺客信條：影》3月20日發(fā)售，預購火爆，你準備好了嗎？

熱門內容

本欄最新

萬寧藍天救援隊：水上機器人顯神威，三名游客成功獲救！

Intel Nova Lake處理器陣容曝光，頂級版本或達48核心？

金價飆升！春節(jié)金飾突破847元每克，牛市通道還能走多遠？

Intel Nova Lake-SK曝光：下代桌面CPU將搭載16大核32小核？

中國紅客聯(lián)盟嚴正聲明：與DeepSeek事件無任何關聯(lián)

中國紅客聯(lián)盟正式聲明：與DeepSeek事件無關，呼吁公眾理性對待

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區(qū) 魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

OpenAI用Reddit數(shù)據測AI說服力，擔憂太強反成隱患

OpenAI用Reddit數(shù)據測AI說服力，擔憂太強反成隱患