• 正文
    • 01新一代Agent運作模式的“變”與“不變”
    • 02單一Agent工作流的具體實現(xiàn)過程
    • 03企業(yè)應該構建什么樣的工具箱
  • 相關推薦
申請入駐 產(chǎn)業(yè)圖譜

AI Agent未來趨勢解析:為何Coze的專家工作流模式不代表未來?

05/08 16:36
734
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

推理模型強化后,Agent具備了自我規(guī)劃能力,從傳統(tǒng)的工作流設定模式衍生出自主創(chuàng)新、自主規(guī)劃的新范式。企業(yè)開始思考能否運用Agent重新定義或落地新場景,這一探索過程也會受到C端的影響。

新一代Agent與上一代以工作流為驅(qū)動的Agent在運作邏輯上存在何種差異?具體如何實現(xiàn)?企業(yè)又該構建怎樣的工具箱?本文將深入分析AI Agent的未來趨勢,助力企業(yè)對Agent工具的理解與落地實踐。

分享嘉賓|張揚 ?愛分析? 聯(lián)合創(chuàng)始人&首席分析師

01新一代Agent運作模式的“變”與“不變”

過去人們所理解的Agent,大多是在用戶輸入(Input)后,在單一Agent的模式下進行任務分解、任務執(zhí)行,包括函數(shù)調(diào)用(Function call)以及輸出答案,例如去年較火的AutoGPT。進入2025年之后,最大的變化是增加了更多的Agent。不同的子Agent參與運作,并非僅有一個Agent處理全流程。

與過去一個Agent解決完整問題相比,其最大優(yōu)勢在于解決問題的細分的子Agent增多,可理解為解決問題的應用專家更多,這使得解決問題的效率和深度都遠超從前。至于為何過去是一個Agent而現(xiàn)在是多個Agent,核心原因在于存在任務分解過程。當用戶輸入一個問題后,會進行任務分解,這與推理模型的出現(xiàn)有較強的相關性。

上圖右邊列出的內(nèi)容展示了解題過程,即用戶輸入問題后具體的子任務分解情況,這與過去的專家工作流解決問題存在顯著差異。其中核心不變的標準是:任何復雜的Agent任務,首先都涉及搜索以及對問題的理解,思維方式與問題理解可歸為同一類別。但觀察后續(xù)不同步驟,其確定性和相關性較低,即每個Agent在運作過程中,若將其視為工作流,每個任務對應的工作流均不相同。在任務拆解為待辦事項或子任務的過程中,基本是基于模型自身推理能力生成合理的工作流,而非像過去那樣通過固定的步驟來解決問題,這是新一代Agent與上一代Agent的最大區(qū)別。

例如同樣是數(shù)據(jù)分析任務,可能由不同Agent分工完成:第一個Agent負責理解客戶需求并將其轉(zhuǎn)化為語義層表述;第二個Agent承擔數(shù)據(jù)獲取工作;第三個Agent則針對回傳數(shù)據(jù)進行分析并生成分析報告。最后一個可能是負責根因分析的Agent,甚至可能存在用于任務檢查的Agent。每個Agent都有其核心工作任務,這構成了任務拆解的基礎。然而,這些Agent的組合與調(diào)度編排由模型自主控制,這與傳統(tǒng)設定工作流的思路完全不同。

以上是Agent發(fā)生變化之處,但也存在不變之處:過去單一Agent運作遵循PDCA閉環(huán),即使在多Agent協(xié)同完成單一任務時,依然是基于PDCA大閉環(huán)進行拆解。其中,問題理解與思維方式對應“P(計劃)”環(huán)節(jié);具體工作執(zhí)行包含“D(執(zhí)行)”和“A(執(zhí)行)”環(huán)節(jié);最終仍存在“C(檢查)”環(huán)節(jié),例如深度搜索中的驗證數(shù)據(jù)、確認最終答案等均屬于驗證過程,并可能根據(jù)驗證結果重新評估數(shù)據(jù)可靠性。由此可見,盡管Agent工作流的具體內(nèi)容及子任務流的工作方式有所改變,但其始終圍繞PDCA閉環(huán)執(zhí)行任務,這便是Agent變化與不變的兩個關鍵要點。

02單一Agent工作流的具體實現(xiàn)過程

首先流程中存在一個分類器,在多數(shù)情況下,該分類器由大語言模型構建,而非推理模型,這體現(xiàn)了大語言模型的優(yōu)勢。大語言模型能夠在任務分解后,高效匹配不同任務與最適合執(zhí)行任務的Agent。新增的任務拆解過程則由推理模型完成。

當選定某個Agent執(zhí)行任務后,便涉及Agent間的協(xié)作,例如一個Agent任務結束后將工作交接給另一個Agent。在此過程中,保存所有對話記錄及記憶至關重要,這些信息將被后續(xù)所有Agent調(diào)用,這構成了多Agent協(xié)作的完整流程,也是當前Agent與過去Agent的顯著差異。由此可見,傳統(tǒng)工作流方式在未來可能不再適用。

上圖左側(cè)展示的是Open AI的Agent邏輯。Open AI于3月發(fā)布的Agent組件包含三個部分:一是API,支持用戶通過API進行調(diào)用;二是Search Tools,既可以操控瀏覽器進行網(wǎng)絡搜索,也能夠?qū)崿F(xiàn)本地文件檢索,滿足公網(wǎng)與內(nèi)網(wǎng)本地內(nèi)容的查找需求;三是Agents SDK,用于實現(xiàn)Agent之間的協(xié)作機制。

該邏輯中不存在預設工作流。上圖右側(cè)為經(jīng)典的Agent框架圖,其中Planning模塊采用思維鏈(COT)技術,通過推理模型的思維鏈實現(xiàn)任務拆解,如去年廣泛使用的典型工具。一種是通過拖拉拽方式構建工作流形成Agent,此方式由專家基于經(jīng)驗設定;另一種是由模型自定義工作流,這兩種方式截然不同。

在推理模型出現(xiàn)前,無論是企業(yè)內(nèi)部還是模型廠商,普遍認可專家基于經(jīng)驗設定工作流的模式。如今,顯著變化在于越來越多的Agent產(chǎn)品開始傾向于由模型創(chuàng)建功能流。例如,Coze近期發(fā)布的最新版本Agent,將原有專家創(chuàng)建工作流轉(zhuǎn)變?yōu)殡p軌制:既支持模型創(chuàng)建工作流,又保留專家創(chuàng)建工作流。由此可見未來存在兩條不同的技術路線,當前兩種路線并行發(fā)展。這一態(tài)勢對未來發(fā)展趨勢影響重大。舉例來說,若未來趨勢是模型創(chuàng)建工作流,那么對于多數(shù)企業(yè)而言,當前專家創(chuàng)建工作流方案中哪些部分能夠在未來復用,哪些部分無法復用,成為企業(yè)關注并亟待解決的問題。

在Agent運作過程中,存在兩種不同的工作流構建思路與方式,專家工作流屬于典型的低代碼和零代碼產(chǎn)品體系。從歷史發(fā)展來看,低代碼產(chǎn)品在中國市場始終未取得重大突破。低代碼和零代碼產(chǎn)品最初期望的最終用戶是企業(yè)用戶,尤其是企業(yè)業(yè)務人員,旨在讓業(yè)務人員基于自身業(yè)務理解自行搭建應用,IT部門僅提供基礎支撐平臺,而非協(xié)助開發(fā)具體應用。

然而在實際應用中,低代碼和零代碼產(chǎn)品的主要使用者多為廠商或其合作伙伴的交付人員,這些交付人員對該類產(chǎn)品的使用最為頻繁。從廠商角度,低代碼和零代碼產(chǎn)品確實能夠降低交付成本。但對于企業(yè)用戶而言,其學習成本和使用門檻過高,導致企業(yè)用戶對這類產(chǎn)品觀感一般,在企業(yè)應用層面作用有限;而對于廠商來說,卻是降低交付成本的有效方式。

從企業(yè)用戶視角出發(fā),即便不考慮專家工作流和模型工作流的技術發(fā)展趨勢,僅就企業(yè)是否愿意采用低代碼和零代碼產(chǎn)品而言,專家工作流的應用前景也存在較大不確定性。專家工作流很可能最終僅成為廠商交付的工具,難以真正被企業(yè)用戶所使用。若將專家工作流和模型工作流視為未來兩大發(fā)展趨勢,那么首要問題是明確長遠發(fā)展趨勢,并確定企業(yè)在當前階段開發(fā)agent應用應遵循的思路。

參考上圖三條曲線表明:在計算量較小、算力較低的應用場景下,采用“More Structure”模式,即對模型進行更多專家設定,模型表現(xiàn)更佳;隨著算力提升,“Less Structure”模式,即減少控制和限制,表現(xiàn)逐漸變好;當算力近乎無窮大時,“Less Structure”模式優(yōu)勢更為顯著。這一AI底層邏輯正獲得越來越多的認可,例如,過去通過大量過程激勵構建模型屬于“More Structure”方式,而DeepSeek采用強化學習構建推理模型則屬于“Less Structure”方式,目前強化學習這種限制較少的模式被普遍認為表現(xiàn)更優(yōu)。將這一思路應用于Agent,邏輯相同。

在前期階段,專家工作流可能表現(xiàn)更優(yōu),因為其中融入了專家的專業(yè)知識以及企業(yè)的專業(yè)經(jīng)驗。然而,隨著算力提升,越過某個臨界點后,模型創(chuàng)建的工作流可能效果更佳,這是可預見的情況。盡管當前算力發(fā)展迅速,但就agent的算力使用情況而言,若前期使用過如Grok3或Open AI,會發(fā)現(xiàn)Agent的算力消耗約為聊天機器人對話的百倍級別。例如,一個聊天機器人對話若消耗100個Token,那么使用Agent時可能消耗約10萬甚至更多Token。從上方圖表可知,造成Token大量消耗的原因有二:

    一是使用Agent執(zhí)行任務時步驟繁多,每一步可能都涉及模型間的交互;二是數(shù)據(jù)量龐大,搜索來源數(shù)量常以百計或數(shù)十計,這些上下文內(nèi)容本身也極為龐大。

因此,若當前模型規(guī)模擴大10倍,模型生成的工作流效果可能遠超專家工作流。這一臨界點預示著未來模型創(chuàng)建工作流將逐步取代專家工作流。但在未來一到三年算力持續(xù)增長的階段,專家工作流仍不可或缺。在此期間,建議將專家工作流從傳統(tǒng)的拖拉拽式操作轉(zhuǎn)變?yōu)樘崾驹~驅(qū)動模式,這可能是更高效的實現(xiàn)方式。同時,需遵循始終不變的PDCA閉環(huán)邏輯。具體而言,提示詞應明確專家流程的步驟,包括使用的工具、展示方式等。其核心邏輯基于兩點:

    無論是過去還是現(xiàn)在的Agent,PDCA閉環(huán)始終是其運作的基本框架,專家工作流也應遵循該邏輯;提示詞作為標準化示例,詳細界定了解決特定問題的步驟,能夠為模型提供可參考的學習樣本。

在R1模型訓練過程中,雖使用的外部高質(zhì)量數(shù)據(jù)較少,但從模型中蒸餾出了60萬條思維鏈(COT)數(shù)據(jù),這些數(shù)據(jù)是該模型的核心競爭力所在。而這些蒸餾數(shù)據(jù)質(zhì)量的優(yōu)劣,取決于前期積累的高質(zhì)量數(shù)據(jù),二者關聯(lián)性極強。因此,從專家工作流的發(fā)展來看,這些提示詞是極具價值的高質(zhì)量數(shù)據(jù)。建議企業(yè)自2025年起開展Agent應用開發(fā)時,除采用拖拉拽方式設置工作流外,更應重視提示詞的核心作用。提示詞的積累與應用,或?qū)⒊蔀槠髽I(yè)內(nèi)部創(chuàng)建更多Agent的重要知識來源。

03企業(yè)應該構建什么樣的工具箱

目前認為,企業(yè)需預置的工具鏈主要涵蓋幾個大類。第一個工具類別與知識相關,需配備兩個檢索工具:一是用于本地私有數(shù)據(jù)的檢索和文件搜索工具,對應Open AI的File Search;二是公網(wǎng)搜索工具,對應Open AI的Web Search API。第二個類別是自動化執(zhí)行的流程工具,如Open AI的Operator,其他類似工具可能叫Computer Use,本質(zhì)是模擬電腦操作。此外,企業(yè)已有的大量機器人流程自動化(RPA)資產(chǎn),也可作為流程自動化工具調(diào)用。第三個類別是Agent協(xié)作工具,包括各類協(xié)作協(xié)議,目前此類工具較多。

除上述三類工具外,還建議配備與企業(yè)專屬分析工具及API接口相關的工具。企業(yè)內(nèi)部大量IT系統(tǒng)需要API接口,同時還需構建眾多專屬分析工具,例如Data Agent分析工具,從長遠看,這是整個Agent體系可調(diào)用的工具組成部分。類似基于PDCA閉環(huán)和提示詞開發(fā)的特定場景應用工具,也可納入其中。例如企業(yè)專屬的財務分析工具、設備運維工具、人力資源(HR)相關工具(如績效輔導工具)等。這些工具基于企業(yè)過去搭建的Agent,可整合為工具箱,納入Agent工具庫。

綜上所述,企業(yè)從當前角度出發(fā),為未來Agent應用儲備的工具箱核心類別包括檢索工具、協(xié)作工具、自動化流程工具、API接口工具以及專屬分析工具。這可能是當前企業(yè)落地Agent時需提前準備的內(nèi)容。

長按二維碼,領取完整版視頻實錄和課件

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

愛分析是一家專注數(shù)字化市場的研究咨詢機構,成立于中國數(shù)字化興起之時,致力于成為決策者最值得信任的數(shù)字化智囊。憑借對新興技術和應用的系統(tǒng)研究,對行業(yè)和場景的深刻洞見,愛分析為數(shù)字化大潮中的企業(yè)用戶、廠商和投資機構,提供專業(yè)、客觀、可靠的第三方研究與咨詢服務,助力決策者洞察數(shù)字化趨勢,擁抱數(shù)字化機會,引領中國企業(yè)數(shù)字化轉(zhuǎn)型升級。