近日,小米公司迎來了一位重量級的新成員——羅福莉,她將在小米AI實驗室中扮演關鍵角色,領導小米的大模型團隊。羅福莉的背景令人矚目,她不僅擁有北京大學計算語言學的碩士學位,還曾在阿里達摩院機器智能實驗室擔任重要職務,主導開發(fā)了多語言預訓練模型VECO,并在DeepSeek參與了MoE大模型DeepSeek-V2的研發(fā)。
據(jù)悉,小米創(chuàng)始人雷軍對公司在大型模型領域的起步較晚表示擔憂,因此決定親自下場,投入巨資招募核心人才。據(jù)知情人士透露,為了吸引羅福莉,小米開出了高達千萬元級別的薪酬。
羅福莉的加入,無疑為小米的技術實力注入了新的活力。在智能手機市場日益激烈的競爭中,AI技術已成為品牌維護用戶群體的核心護城河。隨著芯片算力的持續(xù)提升,AI Agent在智能手機上的應用逐漸成為常態(tài),能夠更好地理解用戶需求,主動完成任務,成為用戶高度定制化的私人助理。據(jù)IDC預測,到2025年,中國新一代AI手機市場出貨量將達到1.18億臺,同比增長59.8%,整體市場占比達到40.7%。
面對這一巨大機遇,小米選擇了輕量化和本地部署作為大模型技術的突破口。從成本、用戶構(gòu)成和產(chǎn)品方面考慮,小米更傾向于在端側(cè)進行AI推理,這不僅可以更接近用戶的數(shù)據(jù),實現(xiàn)更有效的訓練,還能夠大量節(jié)約云端算力開支。同時,小米的用戶對于互聯(lián)網(wǎng)新技術的接受程度較高,這也為其未來部署本地化AI創(chuàng)造了條件。
為了確保本地部署模型的效果,小米團隊開發(fā)了專用的硬件加速模塊,并采用了創(chuàng)新的“TransAct大模型結(jié)構(gòu)化剪枝方法”和端側(cè)量化技術,顯著提升了訓練效率并降低了量化精度損失。目前,小米已經(jīng)成功在端側(cè)部署了MiLM2-4B模型,為未來更多設備的本地化部署打下了堅實基礎。
羅福莉的加入,無疑將加速小米在大模型技術領域的布局。她所研究的語音和文本識別技術,正是目前手機、平板、PC等移動終端以及車機設備中最為常用的場景。羅福莉曾在阿里主導開發(fā)的VECO模型是跨語言理解與生成的典范,為智能終端設備提供了核心技術支撐。她的到來,將進一步提升小米在文本生成與風格轉(zhuǎn)換領域的技術實力。
除了智能手機業(yè)務,小米還在汽車領域展開了大模型技術的實踐。雷軍在演講中提出,通過AI賦能“人車家”生態(tài),推動技術與場景的深度融合。小米的智能駕駛系統(tǒng)通過接入多模態(tài)大模型技術,賦能從語音交互到復雜道路環(huán)境識別的全鏈路場景。目前,小米的端到端全場景智能駕駛系統(tǒng)已經(jīng)展現(xiàn)出了“類人”的駕駛能力,能夠應對多種復雜場景。
小米的大模型技術還深入滲透到AIoT生態(tài)中。從家電控制到安防監(jiān)控,從語音助手到健康管理,大模型技術正賦能每一個AIoT設備。小米希望通過統(tǒng)一的AI框架和大模型算法,實現(xiàn)設備之間的數(shù)據(jù)共享和協(xié)同工作,為用戶帶來更加流暢和智能的體驗。
為了吸引更多頂尖人才,小米不僅提供了高薪酬,還打造了開放的研發(fā)環(huán)境和多樣化的技術交流平臺。小米AI實驗室的研究項目數(shù)量在過去一年增長了45%,其中多模態(tài)交互、圖像生成和語義理解成為重點方向。羅福莉的到來,將加速小米在這些前沿領域的技術落地,進一步縮小與行業(yè)領先者的差距。
不僅如此,小米還在加強與高校和研究機構(gòu)的合作,共同推動AI技術的基礎研究和應用落地。這種雙向合作模式將為小米注入源源不斷的技術創(chuàng)新動力,推動其在大型模型賽道上不斷前行。
在羅福莉的加入下,小米正加快構(gòu)建“人車家”融合的完整智能生活場景。未來,小米將不僅關注技術突破,更將致力于將AI能力與用戶需求深度結(jié)合,為用戶帶來更加智能、便捷和舒適的生活體驗。