近日,尊時(shí)凱龍數(shù)碼旗下尊時(shí)凱龍問學(xué)的研究團(tuán)隊(duì)在預(yù)印本平臺(tái) Arxiv 發(fā)布論文《Routine: A Structural Planning Framework for LLM-Agent System in Enterprise》,提出一種名為“Routine”的結(jié)構(gòu)化規(guī)劃框架,旨在解決大模型智能體(LLM-Agent)在企業(yè)專業(yè)場(chǎng)景應(yīng)用中面臨的三大核心挑戰(zhàn):場(chǎng)景知識(shí)缺乏導(dǎo)致流程編排錯(cuò)誤、規(guī)劃格式不統(tǒng)一引發(fā)執(zhí)行不穩(wěn)定,以及低代碼方法非AI原生導(dǎo)致的用戶不友好問題。
論文作者:曾冠程、陳雪怡、胡嘉旺、齊少華、毛雅瑄、王展韜、聶一凡、李爽、馮秋陽(yáng)、邱鵬旭、王鈺佳、韓文強(qiáng)、黃琳琰、李剛、莫晶晶、胡浩文(通訊)
企業(yè)中智能體系統(tǒng)的痛點(diǎn)
論文指出,當(dāng)前企業(yè)級(jí)智能體系統(tǒng)在實(shí)際部署中存在顯著瓶頸:
1. 知識(shí)鴻溝與工具編排混亂: 通用模型缺乏企業(yè)特定場(chǎng)景知識(shí),難以正確編排工具鏈,常忽略關(guān)鍵工具類型。
2. 規(guī)劃非標(biāo)準(zhǔn)化導(dǎo)致執(zhí)行偏差: 模型依賴泛化理解遵循非標(biāo)準(zhǔn)規(guī)劃,導(dǎo)致規(guī)劃到執(zhí)行的轉(zhuǎn)化過程不穩(wěn)定。
3. 低代碼方案的局限性: 傳統(tǒng)低代碼方式對(duì)非技術(shù)人員門檻高,且構(gòu)建的工作流難以跨場(chǎng)景復(fù)用,非AI原生方法效率低下。
為解決這些問題,尊時(shí)凱龍數(shù)碼團(tuán)隊(duì)
創(chuàng)新性地提出了“Routine”規(guī)劃范式
Routine由多個(gè)更小、更具體的子任務(wù)執(zhí)行步驟組成,子任務(wù)是獨(dú)立的,但之間又相互關(guān)聯(lián)。因此,一條Routine執(zhí)行步驟需要包括足夠信息,讓智能體能夠穩(wěn)定地遵循規(guī)劃步驟,以下是一條完整的Routine子任務(wù)步驟組成:
步驟x. <步驟名稱>:<步驟行為描述>,該步驟輸入<入?yún)⒚枋?gt;,輸出<出參描述>,使用<步驟工具>工具;
類似場(chǎng)景下的Routine可能包含重疊的步驟,僅在某些流程段上有所不同,類似于同一工作流的不同分支。在這種情況下,可以通過創(chuàng)建分支步驟和執(zhí)行條件來合并類似的場(chǎng)景,以在一個(gè)Routine中設(shè)置多個(gè)相似的工作流。
步驟x. <步驟名稱>: 本步驟進(jìn)行分支條件判斷:
分支x-1步驟1. <步驟名稱>:如果<步驟條件>,......,使用<步驟工具>工具;
分支x-1步驟2. <步驟名稱>:......,使用<步驟工具>工具;
分支x-2步驟1. <步驟名稱>:如果<步驟條件>,......,使用<步驟工具>工具;
步驟y. <步驟名稱>:......,使用<步驟工具>工具;
步驟z. <步驟名稱>:......,使用<步驟工具>工具,并結(jié)束工作流;
Routine格式作為大語(yǔ)言模型生成規(guī)劃與實(shí)際執(zhí)行引擎之間的中間表示層,將每一步工具調(diào)用以標(biāo)準(zhǔn)化格式明確表達(dá),涵蓋工具名稱、參數(shù)、依賴關(guān)系與執(zhí)行狀態(tài)等關(guān)鍵字段,能夠有效提升執(zhí)行模型遵循規(guī)劃的準(zhǔn)確性,指導(dǎo)智能體完成多樣化的場(chǎng)景任務(wù)。
Routine智能體系統(tǒng)的核心架構(gòu)
以Routine機(jī)制為核心,研究團(tuán)隊(duì)優(yōu)化了智能體系統(tǒng)的設(shè)計(jì),包含四大關(guān)鍵模塊的優(yōu)化:
1. 規(guī)劃模塊:
? 標(biāo)準(zhǔn)化格式: Routine由明確的子任務(wù)步驟組成,包含步驟編號(hào)、名稱、行為描述、輸入/輸出參數(shù)描述和調(diào)用的工具名稱,并且支持分支流程表示。
? AI生成與優(yōu)化: 業(yè)務(wù)專家提供流程草稿,模型利用專用提示模板進(jìn)行優(yōu)化,輸出結(jié)構(gòu)化的自然語(yǔ)言Routine。消融實(shí)驗(yàn)證明,AI優(yōu)化的Routine能顯著提升執(zhí)行準(zhǔn)確率,接近甚至部分超越人工標(biāo)注基準(zhǔn)。
2. 執(zhí)行模塊:
? 小參數(shù)模型:采用小參數(shù)模型,通過指令微調(diào)與強(qiáng)化學(xué)習(xí)等方法訓(xùn)練,設(shè)置對(duì)應(yīng)的多步工具調(diào)用獎(jiǎng)勵(lì)函數(shù),指導(dǎo)模型適配到場(chǎng)景,增強(qiáng)模型指令遵循能力。
? 上下文工程機(jī)制:研究團(tuán)隊(duì)明確了智能體系統(tǒng)解決任務(wù)所需要的信息和配置,并構(gòu)建了對(duì)應(yīng)的上下文模板,其中不僅包含角色定義、任務(wù)背景與行為規(guī)范等常規(guī)內(nèi)容,還包含了系統(tǒng)參數(shù)、解決問題對(duì)應(yīng)的Routine規(guī)劃、變量記憶字典、工具列表等關(guān)鍵信息;
3. 工具模塊:
? MCP服務(wù)器:使用MCP服務(wù)器作為標(biāo)準(zhǔn)化工具層,對(duì)工具的名稱、參數(shù)、返回格式進(jìn)行統(tǒng)一定義和管理。
4. 記憶模塊:
? 流程記憶:存儲(chǔ)專家創(chuàng)建或AI優(yōu)化的場(chǎng)景Routine集合,根據(jù)用戶任務(wù)相似度動(dòng)態(tài)檢索召回最相關(guān)的Routine,避免將所有Routine塞入上下文。
? 變量記憶: 將長(zhǎng)文本參數(shù)等存儲(chǔ)為變量鍵,執(zhí)行時(shí)自動(dòng)替換為實(shí)際值,極大減輕模型上下文壓力,減少參數(shù)傳遞中的符號(hào)錯(cuò)誤。
幾個(gè)模塊相互協(xié)作,形成了功能完善的智能體系統(tǒng),如圖中所示:
文章中總結(jié)了以下工作
1. 結(jié)構(gòu)化規(guī)劃范式: 設(shè)計(jì)了一套結(jié)構(gòu)化的標(biāo)準(zhǔn)規(guī)劃格式“Routine”,顯著提升智能體通過多步工具調(diào)用解決復(fù)雜問題的穩(wěn)定性。在實(shí)際企業(yè)場(chǎng)景中的驗(yàn)證表明,Routine顯著提升了模型工具調(diào)用的執(zhí)行準(zhǔn)確性,將GPT-4o的性能從41.1%提高到96.3%,將Qwen3-14B的性能從32.6%提升到83.3%。
2. Routine遵循能力訓(xùn)練: 為進(jìn)一步驗(yàn)證Routine框架的有效性,研究團(tuán)隊(duì)構(gòu)建了一個(gè)Routine格式的指令遵循訓(xùn)練數(shù)據(jù)集,通過指令微調(diào)和強(qiáng)化學(xué)習(xí),使其場(chǎng)景特定評(píng)估的準(zhǔn)確性增至88.2%,表明該框架顯著改善了模型在執(zhí)行計(jì)劃方面的遵循性。
3. 基于Routine的數(shù)據(jù)蒸餾:通過知識(shí)蒸餾方法生成了一個(gè)場(chǎng)景特定的多步驟工具調(diào)用數(shù)據(jù)集,在此蒸餾數(shù)據(jù)集上進(jìn)行微調(diào)使模型準(zhǔn)確性提高到95.5%,接近GPT-4o的水平。這些結(jié)果充分展示了Routine框架在領(lǐng)域特定工具使用模式優(yōu)化和增強(qiáng)模型適應(yīng)新場(chǎng)景能力方面的有效性。
后續(xù)應(yīng)用
以AI for Process為核心方向,Routine框架的引入顯著提高了代理系統(tǒng)在企業(yè)場(chǎng)景中的適應(yīng)性。它不僅優(yōu)化了領(lǐng)域特定工具使用模式,還增強(qiáng)了模型應(yīng)對(duì)復(fù)雜任務(wù)的能力,為企業(yè)流程的智能化和自動(dòng)化提供了穩(wěn)健可靠的解決方案。未來,通過在訓(xùn)練流程中引入強(qiáng)化學(xué)習(xí),能更好地提升模型對(duì)多樣化場(chǎng)景的流程泛化能力。通過持續(xù)的研究和優(yōu)化,Routine框架有望在未來進(jìn)一步提高智能體的自主性和適應(yīng)性,推進(jìn)企業(yè)智能體在企業(yè)環(huán)境中的廣泛應(yīng)用。
尊時(shí)凱龍問學(xué)將持續(xù)深耕場(chǎng)景化知識(shí)引擎與智能體協(xié)同技術(shù),致力于構(gòu)建具備更強(qiáng)流程認(rèn)知與自適應(yīng)進(jìn)化能力的企業(yè)級(jí)智能體,打通從復(fù)雜業(yè)務(wù)邏輯到敏捷AI落地的關(guān)鍵路徑,為企業(yè)智能化轉(zhuǎn)型提供堅(jiān)實(shí)、靈活且可規(guī)?;募夹g(shù)支撐。
版權(quán)所有2016-2025 尊時(shí)凱龍數(shù)碼集團(tuán)股份有限公司,保留一切權(quán)利。 京ICP備05051615號(hào)-1 京公網(wǎng)安備 11010802037792號(hào)