在2023年底,斯坦福大學(xué)發(fā)布了一項(xiàng)名為“小鎮(zhèn)模擬游戲”的AI實(shí)驗(yàn)項(xiàng)目,該項(xiàng)目展示了25個(gè)AI角色自主交談、建立關(guān)系并制定計(jì)劃的能力,引發(fā)了業(yè)界的轟動(dòng)。這一創(chuàng)新讓人們開始期待具備自主意識(shí)和決策能力的AI助手的到來。然而,一年后的今天,盡管AI Agent的概念在科技界炙手可熱,但市場(chǎng)上所謂的“Agent”產(chǎn)品卻大多只是具備自然語言理解能力的對(duì)話機(jī)器人,遠(yuǎn)未達(dá)到人們的期望。
這種“形似神不似”的現(xiàn)象在AI硬件領(lǐng)域同樣存在。2024年10月,智能戒指品牌Oura推出了最新款Oura Ring 4,并加入了AI功能,迅速獲得了市場(chǎng)的認(rèn)可,估值超過50億美金。然而,業(yè)內(nèi)普遍認(rèn)為,Oura的成功主要?dú)w功于其健康追蹤功能,而非AI技術(shù)。相比之下,那些主打AI的硬件產(chǎn)品,如AI Pin和Rabbit R1,卻遭遇了市場(chǎng)的冷遇。
2024年,AI Agent市場(chǎng)呈現(xiàn)出“一半是海水,一半是火焰”的景象。一方面,科技巨頭如微軟、谷歌和OpenAI紛紛布局AI Agent領(lǐng)域,推出了各自的產(chǎn)品和計(jì)劃。例如,微軟宣布將在Dynamics 365業(yè)務(wù)應(yīng)用平臺(tái)上部署10款A(yù)I Agent,服務(wù)于企業(yè)的銷售、會(huì)計(jì)和客戶服務(wù)等領(lǐng)域;谷歌則發(fā)布了Gemini 2.0多模態(tài)大模型,并內(nèi)置了三款A(yù)I Agent。另一方面,市場(chǎng)上的AI Agent產(chǎn)品大多未能達(dá)到用戶的期望,存在性能不穩(wěn)定、輸出不精確等問題。
AI Agent的技術(shù)進(jìn)步也在不斷推進(jìn)。根據(jù)Lilian Weng的公式,AI Agent由LLM(大型語言模型)、Memory(記憶機(jī)制)、Planning skills(規(guī)劃能力)和Tool use(工具使用)組成。近年來,這些技術(shù)都取得了顯著的進(jìn)步。例如,OpenAI提出了System 1/2 thinking技術(shù),讓AI模型具備了更強(qiáng)的推理能力;谷歌DeepMind則開發(fā)了Talker-Reasoner框架,通過“雙引擎”模式提升了AI Agent解決復(fù)雜任務(wù)的能力。記憶機(jī)制、工具使用和規(guī)劃能力等方面的進(jìn)步也為AI Agent的發(fā)展提供了有力支持。
在資本市場(chǎng)上,AI Agent也成為了投資人的新寵。2024年,國內(nèi)AI領(lǐng)域發(fā)生了317起融資案例,其中AI Agent項(xiàng)目獲得了18起融資,與大模型項(xiàng)目并列成為最受關(guān)注的方向。投資人認(rèn)為,垂直領(lǐng)域的AI Agent作為一種新興B2B軟件,有望成為比SaaS市場(chǎng)更大的新興市場(chǎng),可能催生出市值超過3000億美元的科技巨頭。
盡管市場(chǎng)上尚未出現(xiàn)真正的“全能Agent”,但在垂直領(lǐng)域,AI Agent已經(jīng)展現(xiàn)出了巨大的潛力。例如,在編程領(lǐng)域,Cursor等AI編程工具已經(jīng)能夠幫助程序員自動(dòng)生成代碼;在問卷調(diào)查和分析領(lǐng)域,Outset等AI Agent能夠替代傳統(tǒng)的人工調(diào)查和分析工作。這些垂直領(lǐng)域的AI Agent不僅提高了工作效率,還降低了成本,為企業(yè)帶來了顯著的商業(yè)價(jià)值。
展望未來,AI Agent有望在更多領(lǐng)域發(fā)揮重要作用。隨著技術(shù)的不斷進(jìn)步和市場(chǎng)的日益成熟,AI Agent將成為企業(yè)數(shù)字化轉(zhuǎn)型的重要工具之一。同時(shí),AI Agent的發(fā)展也將推動(dòng)人工智能技術(shù)的進(jìn)一步普及和應(yīng)用,為人類社會(huì)帶來更多的便利和創(chuàng)新。