7月26日,在2025世界人工智能大會(huì)“AI煥新 產(chǎn)業(yè)共贏”企業(yè)人工智能產(chǎn)業(yè)發(fā)展論壇上,中國(guó)移動(dòng)正式發(fā)布了原創(chuàng)提出并自主打造的多模型和智能體聚合及服務(wù)引擎MoMA(Mixture of Models and Agents),這是中國(guó)移動(dòng)充分發(fā)揮自身優(yōu)勢(shì)稟賦、構(gòu)建特色智能服務(wù)模式、加快實(shí)現(xiàn)人工智能全要素運(yùn)營(yíng)的標(biāo)志性創(chuàng)新成果。

MoMA通過(guò)標(biāo)準(zhǔn)化接口自動(dòng)感應(yīng)和探索各類模型、智能體和工具,實(shí)現(xiàn)動(dòng)態(tài)路由、智能規(guī)劃、精準(zhǔn)調(diào)度,提供高準(zhǔn)確、高安全、高可靠、高效能的大模型推理服務(wù)。在模型回復(fù)質(zhì)量持平的條件下,MoMA動(dòng)態(tài)路由和調(diào)度九天各參數(shù)模型相較于固定大參數(shù)模型平均每百萬(wàn)使用量的推理速度提升42%,在數(shù)學(xué)、代碼等典型場(chǎng)景中,速度提升為134%。
MoMA技術(shù)架構(gòu)主要涵蓋三大組成部分:MoMA模型、MoMA引擎及MoMA協(xié)議。MoMA模型,依據(jù)模型探測(cè)能力、智能體探測(cè)能力及對(duì)用戶意圖的識(shí)別理解,精準(zhǔn)解析用戶輸入判斷模型和智能體依賴關(guān)系及能力范圍,自動(dòng)選擇最優(yōu)方案,構(gòu)建“實(shí)時(shí)感知-動(dòng)態(tài)調(diào)整-持續(xù)驗(yàn)證”的循環(huán)鏈路,更好的適應(yīng)數(shù)據(jù)變化、業(yè)務(wù)需求和環(huán)境波動(dòng),做最懂模型和智能體的模型;MoMA引擎,調(diào)度對(duì)象多樣化,構(gòu)建React模式,通過(guò)中心調(diào)度、權(quán)限集中的形式,實(shí)現(xiàn)主智能體、用戶及智能體的多樣化調(diào)度。通過(guò)分布式AI資源池,自動(dòng)完成任務(wù)拆分與分發(fā),實(shí)現(xiàn)去中心化調(diào)度以及模型、智能體的快速拓展,實(shí)現(xiàn)全局靈活調(diào)度,服務(wù)主動(dòng)推送;MoMA協(xié)議,中國(guó)移動(dòng)創(chuàng)新設(shè)計(jì)一套特色接入標(biāo)準(zhǔn),既兼容業(yè)界通用MCP/A2A/OpenAI服務(wù)規(guī)范,又支持企業(yè)私有化需求,增強(qiáng)移動(dòng)認(rèn)證及安全通信等能力。
目前MoMA已應(yīng)用于中國(guó)移動(dòng)的靈犀智能體2.0,助力靈犀智能體2.0全面升級(jí)為跨領(lǐng)域、多任務(wù)、自規(guī)劃的通用型智能體,為用戶在“辦公、生活、出行、家庭、通信”等多元化場(chǎng)景中提供特色服務(wù)。MoMA也將作為中國(guó)移動(dòng)平臺(tái)級(jí)MaaS服務(wù)的中樞引擎,可以緊扣行業(yè)應(yīng)用場(chǎng)景需求,自動(dòng)匹配及調(diào)用最優(yōu)專家模型和專用智能體,解決行業(yè)客戶大模型技術(shù)選型難、使用成本高、替換難度大等普遍痛點(diǎn)。
MoMA引擎的推出,是中國(guó)移動(dòng)強(qiáng)化人工智能時(shí)代“供給者、匯聚者、運(yùn)營(yíng)者”定位的全新實(shí)踐。通過(guò)MoMA引擎,中國(guó)移動(dòng)將構(gòu)建起百模互聯(lián)、千智協(xié)同的全新產(chǎn)業(yè)協(xié)同生態(tài),為我國(guó)人工智能產(chǎn)業(yè)形成能力聚合倍增和優(yōu)質(zhì)普惠服務(wù)的全新發(fā)展范式起到基礎(chǔ)性和關(guān)鍵性驅(qū)動(dòng)效應(yīng)。