ITBear旗下自媒體矩陣:

2024年AI評測新風尚:從“史密斯吃面”到游戲?qū)?zhàn),誰更接地氣?

   時間:2025-01-01 13:11:07 來源:ITBEAR編輯:快訊團隊 發(fā)表評論無障礙通道

在人工智能技術(shù)的飛速發(fā)展下,一個令人啼笑皆非的現(xiàn)象悄然興起:每當有新的視頻生成器問世,網(wǎng)絡(luò)上總會出現(xiàn)一段威爾·史密斯享用意大利面的視頻。這一場景,似乎成了新技術(shù)試金石,用以檢驗AI能否以假亂真,重現(xiàn)史密斯大快朵頤的瞬間。TechCrunch對此進行了詳細報道,指出這一現(xiàn)象已超越了簡單的網(wǎng)絡(luò)迷因,成為了衡量AI視頻生成能力的非正式標準。

有趣的是,史密斯本人也于二月通過Instagram回應(yīng),親自模仿了這一場景,加入了這場由AI引發(fā)的網(wǎng)絡(luò)狂歡。但這僅僅是2024年人工智能領(lǐng)域眾多奇特“民間”評測標準中的一個縮影。早前,一位16歲的開發(fā)者創(chuàng)建了一款應(yīng)用,讓AI操控《我的世界》游戲,以此測試其建筑設(shè)計的智慧。同時,英國一位程序員也搭建了一個平臺,讓AI在“你畫我猜”和“四子棋”等游戲中展開對決,進一步探索AI的娛樂潛能。

盡管人工智能領(lǐng)域不乏專業(yè)的性能測試,但這些略顯古怪的測試方式卻意外走紅。原因在于,許多專業(yè)的AI基準測試對于普通大眾而言,顯得過于深奧難懂。企業(yè)常常強調(diào)AI在解決奧林匹克數(shù)學難題或博士級別問題上的能力,然而,大多數(shù)人使用聊天機器人的目的,僅僅是進行日常對話或回復(fù)郵件,這些高深的測試與他們的實際需求相去甚遠。

即便是行業(yè)內(nèi)廣泛采用的評測方法,也并非盡善盡美。以備受關(guān)注的“聊天機器人競技場”為例,該平臺允許網(wǎng)絡(luò)用戶對AI在特定任務(wù)上的表現(xiàn)進行評分,如開發(fā)網(wǎng)頁應(yīng)用或生成圖像。然而,參與評分的用戶大多來自人工智能和科技行業(yè),他們的投票往往基于個人偏好,缺乏代表性,這使得評測結(jié)果的公正性和普適性受到質(zhì)疑。

相比之下,“四子棋”、“我的世界”以及“威爾·史密斯吃面條”等另類基準測試,雖然缺乏嚴謹性,卻因其娛樂性和易理解性而廣受歡迎。當然,這些測試也存在局限性,AI在某一任務(wù)上的出色表現(xiàn),并不能直接反映其在其他任務(wù)上的能力。例如,能夠完美生成“威爾·史密斯吃面條”視頻的AI,未必能準確生成漢堡的圖像。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version