科銳國際近期宣布了一項重大技術(shù)進(jìn)展,該公司已成功接入了DeepSeek-R1大模型,旨在深化人工智能技術(shù)在中高端招聘領(lǐng)域的應(yīng)用,以期實現(xiàn)人才匹配效率的大幅提升。
作為國內(nèi)首家在A股上市的人力資源服務(wù)企業(yè),科銳國際在全球擁有超過100家分支機構(gòu),業(yè)務(wù)范圍涵蓋中高端人才搜索、招聘流程外包、靈活用工等全方位服務(wù),以及HR SaaS、垂直領(lǐng)域招聘平臺等多元化產(chǎn)品。據(jù)統(tǒng)計,科銳國際已成功推薦近2萬名中高端管理及專業(yè)技術(shù)人員,靈活用工累計派遣人數(shù)超過38.3萬。
科銳國際CTO劉之表示,DeepSeek-R1大模型的推出,不僅令人矚目,更將推動Agents技術(shù)的進(jìn)一步發(fā)展。他強調(diào),DeepSeek-R1是OpenAI o1模型的平替版本,且更具經(jīng)濟性。DeepSeek-R1在大規(guī)模強化學(xué)習(xí)領(lǐng)域的原創(chuàng)性創(chuàng)新,開創(chuàng)了新的先河。盡管模型優(yōu)勢可能不會持續(xù)存在,因為社區(qū)跟進(jìn)速度很快,但跨學(xué)科深度融合的團隊總能創(chuàng)造出卓越的創(chuàng)新,這是最值得尊敬和學(xué)習(xí)的。
劉之透露,盡管OpenAI在去年9月已發(fā)布o(jì)1推理大模型,科銳國際已開始嘗試?yán)胦1為跨數(shù)據(jù)源的復(fù)雜RAG(檢索增強生成)任務(wù)提供更高效的拆解能力,并預(yù)研更依賴推理能力的Agents。DeepSeek-R1與o1在推理能力上相似,因此并未改變科銳國際的產(chǎn)品方案和策略。然而,與o1不同的是,DeepSeek-R1的思維鏈?zhǔn)峭该鞯模@在進(jìn)行意圖理解和任務(wù)規(guī)劃時,可將產(chǎn)品轉(zhuǎn)變?yōu)榻换捠?,從而極大提升用戶體驗。
據(jù)劉之預(yù)測,隨著科銳國際在不同場景接入更多模型,DeepSeek-R1完全有能力成為RAG和Agents的主力模型。事實上,DeepSeek系列模型自發(fā)布以來,已給OpenAI等大模型廠商帶來了不小的壓力。DeepSeek-V3和DeepSeek-R1的相繼推出,不僅展示了其強大的語言理解與生成能力,還因可能更低的訓(xùn)練成本而受到關(guān)注。盡管DeepSeek-R1的具體訓(xùn)練成本未公開,但DeepSeek-V3的訓(xùn)練預(yù)算已公布為“2048個GPU、2個月、近600萬美元”,外界普遍認(rèn)為R1的訓(xùn)練成本可能更低。
春節(jié)期間,國內(nèi)外從芯片制造商到云服務(wù)提供商,都迅速宣布了對DeepSeek的支持??梢灶A(yù)見,在不同GPU和云算力平臺上,DeepSeek系列模型將展現(xiàn)出不同的性能表現(xiàn)。劉之指出,目前獨立部署DeepSeek-R1滿血版的成本仍然過高,因此科銳國際選擇直接采用云服務(wù)廠商的API。
科銳國際早在2023年下半年就公開表示,已訓(xùn)練了面向技能與招聘的行業(yè)級預(yù)訓(xùn)練語言模型CRE(Career International Recruitment Embedding)。然而,科銳國際并未選擇直接訓(xùn)練行業(yè)垂直大模型的路線,而是選擇以行業(yè)垂直的Embedding模型和RAG技術(shù)為核心技術(shù)路線。這一決策基于科銳國際對AI技術(shù)發(fā)展趨勢的準(zhǔn)確判斷:一是AI計算范式的轉(zhuǎn)變,即通過大量數(shù)據(jù)和算力提升性能;二是通用大模型的集中化趨勢明顯,而垂直行業(yè)大模型面臨諸多技術(shù)難題。
為了提升招聘效率和精準(zhǔn)性,科銳國際一直在研發(fā)Embedding模型和提供RAG能力的MatchSystem匹配系統(tǒng)。劉之指出,大模型接入企業(yè)內(nèi)部數(shù)據(jù)有三種方法:RAG、ICL上下文學(xué)習(xí)和微調(diào)。在擁有大量數(shù)據(jù)的情況下,RAG是不可或缺的方法,而RAG又離不開搜索系統(tǒng)和Embedding??其J國際自2022年開始布局?jǐn)?shù)據(jù)中臺建設(shè),逐漸構(gòu)建了一個龐大的數(shù)據(jù)系統(tǒng),廣泛覆蓋20多個行業(yè)與細(xì)分領(lǐng)域。這些數(shù)據(jù)使得CRE Embedding模型能夠在真實場景中更好地貼合實際分布,從而提升匹配的精準(zhǔn)度和效率。
CRE Embedding模型基于700GB公開數(shù)據(jù)和40GB行業(yè)簡歷與招聘需求數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練和任務(wù)微調(diào)。它能夠深刻理解崗位需求和候選人簡歷中的復(fù)雜語義關(guān)系。由于招聘數(shù)據(jù)與連貫性文本不同,招聘數(shù)據(jù)通常采用掃視閱讀方式,因此在模型架構(gòu)設(shè)計時更加關(guān)注局部關(guān)系。同時,通過多粒度特征融合和Transformer變體等技術(shù),使得CRE模型更符合招聘場景。
為了彌補Embedding模型的缺陷,MatchSystem結(jié)合了關(guān)鍵詞檢索,形成了一個混合檢索系統(tǒng)。同時,MatchSystem還結(jié)合了RAG技術(shù),以滿足更靈活的查詢需求。劉之表示,科銳國際之所以選擇這一研發(fā)路徑,不僅受到大環(huán)境的影響,更是因為原有的技術(shù)方案已無法滿足需求。例如,在招聘場景中,人崗匹配過去依賴標(biāo)簽或知識圖譜方法,但在中高端崗位招聘中會遇到問題。因此,科銳國際開始自研Embedding模型和MatchSystem匹配系統(tǒng)。
據(jù)悉,MatchSystem可準(zhǔn)確匹配垂直類崗位的招聘需求,而非泛泛之談。例如,在算法工程師這一細(xì)分崗位上,MatchSystem系統(tǒng)能夠?qū)崿F(xiàn)精準(zhǔn)匹配。在獲客方面,原先需要花費一周時間匹配候選人與企業(yè)用人需求的繁瑣過程,現(xiàn)在通過MatchSystem系統(tǒng)可實時完成。