在科技日新月異的今天,AI Agent正逐漸從理論走向?qū)嵺`,被視為引領(lǐng)人類文明進入新紀(jì)元的“火種”。2024年,這一概念熱度空前,不僅因為大模型賽道競爭激烈且趨于飽和,更因為AI Agent被視為大模型落地應(yīng)用的最優(yōu)解,能夠突破LLMs在具體場景中的局限性。
那么,當(dāng)前AI Agent的采用現(xiàn)狀如何?哪些領(lǐng)域正率先邁出步伐?為了解答這些問題,我們深入分析了LangChain與Langbase發(fā)布的兩份關(guān)于AI Agent的權(quán)威報告,試圖揭示其在開發(fā)與采用過程中的關(guān)鍵信息。
首先,從采用主體來看,LangChain的調(diào)查顯示,超過半數(shù)的受訪者已經(jīng)在生產(chǎn)環(huán)境中部署了AI Agent,且超過七成計劃在未來引入。中型企業(yè)在采用上最為積極,而非科技公司與科技公司的采用率幾乎持平。Langbase的數(shù)據(jù)則顯示,雖然目前AI(非AI Agent)的實驗用途仍大于生產(chǎn)用途,但生產(chǎn)用途正在穩(wěn)步增長。
在AI Agent的基座大模型方面,OpenAI憑借76%的采用率占據(jù)主導(dǎo)地位,谷歌則以59%的采用率迅速崛起,成為其強勁對手。Anthropic、meta的Llama、Mistral和Cohere等也展現(xiàn)出一定的競爭力。各大模型在不同領(lǐng)域的應(yīng)用也各有千秋,如OpenAI在技術(shù)和營銷領(lǐng)域領(lǐng)先,谷歌在健康和翻譯領(lǐng)域表現(xiàn)出色。
在選擇AI Agent基座大模型時,準(zhǔn)確性被受訪者視為最重要的因素,其次是安全性和可定制性,成本影響相對較小。這一結(jié)果與企業(yè)采用AI Agent時的顧慮基本一致。
在具體應(yīng)用場景上,LangChain的調(diào)查顯示,研究與總結(jié)、個人生產(chǎn)力工具和客戶服務(wù)是AI Agent的主要應(yīng)用領(lǐng)域。這些場景體現(xiàn)了AI Agent在提煉關(guān)鍵信息、提升個人效率和快速處理客戶咨詢方面的強大能力。而Langbase的數(shù)據(jù)則顯示,軟件開發(fā)是AI大模型應(yīng)用最廣泛的領(lǐng)域,其次是文本摘要、市場營銷等。
然而,在生產(chǎn)中采用AI Agent也面臨諸多挑戰(zhàn)。性能質(zhì)量是首要關(guān)注點,遠超成本和安全等因素。AI Agent依賴LLM“黑盒”控制工作流程,帶來不可預(yù)測性,增加了出錯風(fēng)險。知識不足和時間有限也是團隊面臨的主要問題。Langbase的調(diào)查還顯示,復(fù)雜的擴展和部署過程、數(shù)據(jù)隱私和安全合規(guī)性、缺乏監(jiān)控工具和高昂的基礎(chǔ)設(shè)施成本也阻礙了AI Agent的落地應(yīng)用。
在AI Agent的開發(fā)過程中,定制化難度高、缺乏用于質(zhì)量保證的評估方法和可重復(fù)使用的基礎(chǔ)設(shè)施不足是關(guān)鍵挑戰(zhàn)。開發(fā)者對版本控制、強大的SDK、庫生態(tài)系統(tǒng)和本地開發(fā)環(huán)境等功能表示出強烈需求。同時,多代理RAG能力、評估工具和多代理流水線也是實現(xiàn)復(fù)雜任務(wù)的關(guān)鍵技術(shù)。
展望未來,企業(yè)在采用AI Agent時既充滿期待也面臨挑戰(zhàn)。期待AI Agent能夠處理多步驟任務(wù)、自動化重復(fù)性任務(wù)、優(yōu)化任務(wù)分配與協(xié)作,并具備類人推理能力。然而,AI Agent的黑盒機制仍是一大難題,工程師難以向團隊和利益相關(guān)者解釋其功能和行為。開源AI Agent的興起和更強大模型的期待也為企業(yè)帶來了新的機遇和挑戰(zhàn)。