圖注:微軟AI CEO穆斯塔法·蘇萊曼
2024年諾貝爾獎(jiǎng)的各個(gè)獎(jiǎng)項(xiàng)已經(jīng)全部揭曉,令人矚目的是,諾貝爾物理學(xué)獎(jiǎng)與化學(xué)獎(jiǎng)雙雙花落AI領(lǐng)域。AI技術(shù)及其應(yīng)用成為今年諾獎(jiǎng)最大的亮點(diǎn)。諾獎(jiǎng)對(duì)AI相關(guān)成果及科學(xué)家的高度認(rèn)可,不但有力地推動(dòng)了AI技術(shù)的進(jìn)一步發(fā)展和跨學(xué)科研究的深化,也預(yù)示著AI將以更快的速度推動(dòng)人類社會(huì)的經(jīng)濟(jì)增長(zhǎng)和高質(zhì)量發(fā)展。
AI的發(fā)展速度驚人,這在人類歷史上尚屬首次——機(jī)器學(xué)會(huì)了運(yùn)用我們的語(yǔ)言。但AI所提供的信息能否符合人類的認(rèn)知需求和價(jià)值判斷?AI能否真正理解語(yǔ)言背后的情感內(nèi)涵?在AI與人類深度交互的背景下,如何確保數(shù)據(jù)和隱私安全?從長(zhǎng)遠(yuǎn)來看,哪些挑戰(zhàn)可能成為制約AI持續(xù)發(fā)展的根本性因素?
在直面這些難題的同時(shí),蘇萊曼先生對(duì)如何最大限度利用技術(shù)滿足用戶需求給出了一個(gè)清晰的路線圖。他探討了人工智能的發(fā)展、倫理問題以及未來的技術(shù)前景。這正是本次蘇萊曼先生采訪帶來的啟示。
張祺博士
微軟全球資深副總裁
微軟AI亞太區(qū)總裁
穆斯塔法·蘇萊曼與WIRED的資深記者Will Knight近期的深度訪談:
觀點(diǎn)導(dǎo)讀
Copilot 愿景:
我們的目標(biāo)是創(chuàng)造一種伙伴間的持續(xù)互動(dòng)體驗(yàn)。這不僅僅關(guān)乎技術(shù),更在于提供情感支持。這正是科技時(shí)代的迷人之處——和真正理解你的AI伙伴互動(dòng)。它會(huì)引導(dǎo)、鼓勵(lì)、支持并教導(dǎo)你,讓你不再覺得是在與一臺(tái)機(jī)器交流。
AI 智能體的三個(gè)階段:
信息處理階段:AI處理你所處理的相同信息——看到你所看到的,聽到你所聽到的,閱讀你所閱讀的文本。
長(zhǎng)期記憶階段:AI擁有長(zhǎng)期、持久的記憶,隨著時(shí)間的推移建立起共同的理解。
交互階段:AI通過發(fā)送指令和采取行動(dòng)與第三方交互——購(gòu)買物品、預(yù)訂服務(wù)、規(guī)劃日程。
與OpenAI的關(guān)系:
我們對(duì)OpenAI的模型進(jìn)行了微調(diào),使其不僅專注于數(shù)學(xué)和科學(xué)問題解決,還能進(jìn)行并列比較和消費(fèi)者分析。當(dāng)你遇到難題或想要推理某件事情時(shí),它能夠進(jìn)行并列比較或大規(guī)模分析。
AI的挑戰(zhàn):
挑戰(zhàn)在于如何打造可信賴的技術(shù),使其感覺像一個(gè)非常親密和個(gè)性化的體驗(yàn)。建立信任體驗(yàn)的基礎(chǔ)后,我們可以深入到更復(fù)雜的方面,例如代表你購(gòu)買東西、進(jìn)行談判、簽訂合同或規(guī)劃日程。
完整訪談
主持人: Copilot的愿景是什么?
穆斯塔法·蘇萊曼: 我們正處于一個(gè)驚人的轉(zhuǎn)型點(diǎn)。AI伙伴現(xiàn)在能夠看到我們所見,聽到我們所聽,并使用我們溝通的同一種語(yǔ)言。這種新的設(shè)計(jì)理念關(guān)注的是持久性、關(guān)系和情感。我們正在打造一種體驗(yàn),是關(guān)于與伙伴進(jìn)行持久、持續(xù)互動(dòng)。
主持人: 你從Inflection AI加入微軟,該公司專注于構(gòu)建支持性和同理心的AI。聽起來你在新的雇主這里也保持了這種理念。
穆斯塔法·蘇萊曼: 我一直相信AI具備提供支持的潛力。情感支持實(shí)際上是我19歲時(shí)參與的第一個(gè)項(xiàng)目,那時(shí)我啟動(dòng)了一項(xiàng)電話咨詢服務(wù)。這正是這個(gè)技術(shù)時(shí)代的美妙之處——與一個(gè)真正了解你的AI伙伴互動(dòng)。它會(huì)指導(dǎo)你、鼓勵(lì)你、支持你、教導(dǎo)你。我認(rèn)為這將不再讓人感覺像是在跟一臺(tái)計(jì)算機(jī)互動(dòng)。
主持人: Copilot Vision是什么?這個(gè)“l(fā)abs”功能將讓Pro用戶嘗試到什么?
穆斯塔法·蘇萊曼: Copilot Vision讓你能夠說“那邊的東西是什么(在你的屏幕上)?”或“等一下,那是什么?你覺得那個(gè)怎么樣?”在你坐在電腦前時(shí),會(huì)有很多這樣的小瞬間。這個(gè)AI伙伴可以看到你所見,并實(shí)時(shí)與你討論你正在看的內(nèi)容,這是非常了不起的。它在某種程度上改變了你在數(shù)字生活中的體驗(yàn),因?yàn)槟悴槐卦儋M(fèi)力鍵入內(nèi)容。
主持人: 這聽起來像是Recall,那項(xiàng)有爭(zhēng)議的、現(xiàn)在需要選擇的Windows功能,用于記錄用戶屏幕上的內(nèi)容。
穆斯塔法·蘇萊曼: 保護(hù)用戶的隱私是至關(guān)重要的。目前我們不會(huì)用Copilot Vision保存任何內(nèi)容,因此一旦會(huì)話結(jié)束后關(guān)閉瀏覽器,所有內(nèi)容都會(huì)消失,完全刪除。但我在思考是否以及如何在未來引入這一功能,因?yàn)楹芏嗳舜_實(shí)希望有這樣的體驗(yàn)。如果你可以說,“我前幾天在網(wǎng)上看到的那張圖片是什么?那個(gè)表情包是什么?”我想我們總有一天得研究這個(gè)問題。不過目前,Copilot Vision工具是這樣的。我們需要隨著時(shí)間進(jìn)行實(shí)驗(yàn),看看如何在這方面做更有意義的事情。
主持人: 你們還推出了Think Deeper,這將使Copilot能夠處理更復(fù)雜的問題。這是基于OpenAI的o1模型,也就是Strawberry,對(duì)嗎?
穆斯塔法·蘇萊曼: 是的,類似于Strawberry。我們對(duì)OpenAI的模型進(jìn)行了調(diào)整,為了更符合消費(fèi)者的需求,我們讓它以一種更符合AI伙伴主題的方式運(yùn)行。
主持人: 有什么區(qū)別?
穆斯塔法·蘇萊曼: OpenAI的模型更專注于純數(shù)學(xué)和科學(xué)問題的解決。我們?cè)噲D讓它專注于并列比較和消費(fèi)者分析等內(nèi)容。當(dāng)你在解決一個(gè)難題時(shí)卡住了,想要推理時(shí),它可以真正列出一個(gè)并列比較,或者進(jìn)行大規(guī)模分析。
主持人: 微軟的人們已經(jīng)在使用這個(gè)新版本的Copilot了嗎?
穆斯塔法·蘇萊曼: 是的,大家都在使用。我們幾天前剛在公司內(nèi)部全面上線。所以每個(gè)人都在使用,并且提供大量反饋。我們的反饋渠道非常繁忙,這很有趣。
主持人: 人們會(huì)記得Clippy,微軟最后一個(gè)Windows AI助手。那里的員工有看到相似之處嗎?
穆斯塔法·蘇萊曼: 我前幾天見到了比爾·蓋茨,他說,你知道嗎,你給整個(gè)AI的命名搞錯(cuò)了?應(yīng)該叫Clippy。這確實(shí)顯示了蓋茨這樣的人的前瞻性。他們不僅能預(yù)見未來兩年,還能預(yù)見未來二十年。
主持人: 新功能是否是朝著所謂的AI伙伴邁進(jìn)了一步,AI伙伴可以在電腦上幫你處理有用的瑣事嗎?
穆斯塔法·蘇萊曼: 是的,絕對(duì)是。
第一階段是AI處理與用戶相同的信息——看到用戶所見、聽到用戶所聽、閱讀用戶閱讀的文本。第二階段是AI具備長(zhǎng)期、持續(xù)的記憶,隨著時(shí)間的推移建立起共同理解。第三階段是AI通過發(fā)送指令和采取行動(dòng)與第三方互動(dòng)——比如購(gòu)買東西、預(yù)訂東西、規(guī)劃日程。我們正在研發(fā)實(shí)驗(yàn)?zāi)J街械倪@兩個(gè)功能。
主持人: 你們有一個(gè)可以為你去購(gòu)買東西的Windows人工智能代理嗎?
穆斯塔法·蘇萊曼: 還有一段路要走,但沒錯(cuò),我們已經(jīng)完成了閉環(huán),實(shí)現(xiàn)了交易。這項(xiàng)技術(shù)的問題是,你可以讓它在50%、60%的情況下運(yùn)行,但要達(dá)到90%的可靠性還需要付出很多努力。我已經(jīng)看到了一些令人驚艷的演示,它可以獨(dú)立完成購(gòu)買等操作。但我也見過一些出狀況的時(shí)候,技術(shù)不知所措,無法正確應(yīng)對(duì)。
主持人: 能多告訴我一點(diǎn)所謂“出狀況”的事嗎?它是否用蓋茨的信用卡去買了輛蘭博基尼?
穆斯塔法·蘇萊曼: 如果它用的是蓋茨的信用卡,那就好笑了。但不,如我所說我們還在一步步摸索。這項(xiàng)技術(shù)仍然處于實(shí)驗(yàn)室階段。還有很長(zhǎng)的路要走,但我想進(jìn)展可以按季度來計(jì)算,而不是按年。
主持人: 在實(shí)現(xiàn)你所描述的人工智能未來的過程中,你面臨的最大挑戰(zhàn)是什么?
穆斯塔法·蘇萊曼: 這里的關(guān)鍵在于如何打造一種值得信任的技術(shù),因?yàn)檫@將是一種非常親密和個(gè)人化的體驗(yàn)。我們必須做好安全和隱私的部分。我認(rèn)為真正的挑戰(zhàn)在于如何設(shè)計(jì)對(duì)話,使AI伙伴能夠明確地表達(dá)邊界,能夠說出“這是我不準(zhǔn)備參與的事情”。
如果我們能做到這一點(diǎn),那就是建立信任體驗(yàn)的基礎(chǔ),然后我們就可以進(jìn)一步推動(dòng)更復(fù)雜的方面,例如讓它代表你購(gòu)買東西、代表你談判、代表你簽訂合同,或者為你規(guī)劃一個(gè)周六下午涉及三四個(gè)不同站點(diǎn)的行程。你會(huì)說:“我相信你,Copilot,你能搞定,對(duì)嗎?”這正是我們努力的方向。