現時大部分 AI Agent 其實都只活在「當下」。它們可以即時理解用戶問題、查資料、使用工具,但一段對話完結後,之前成功或失敗的做法基本上就會消失。結果即使遇到相似問題,Agent 仍然會重新試錯,重複犯同樣錯誤。
AWS 最近在 Bedrock AgentCore 加入 Episodic Memory(情節記憶),嘗試解決這個長期存在的問題。簡單來說,這個功能令 Agent 不單記得「知道甚麼」,而是記得「以前如何解決類似問題」,包括目標、思考過程、用過的工具,以及最後是否成功。
若曾接觸 Agent 設計,可能已經聽過 Semantic Memory(語義記憶)或 Session Memory。前者負責記住事實與知識,後者則確保對話不會太快「失憶」。
Episodic Memory 的定位完全不同。它記錄的是一次完整「經歷」,由用戶提出需求開始,到 Agent 作出一連串決定,再到最後結果與反思。換句話說,就像幫 Agent 記錄一個個真實案例,而不只是儲存資料。對企業級應用而言這一點特別重要,因為實際任務通常涉及多個步驟,而且錯一次就可能影響用戶體驗,甚至涉及合規風險。
在 AgentCore 內,Episodic Memory 並非單純儲存聊天記錄,而是經過一個結構化處理流程。
系統會先分析每一次用戶與 Agent 的互動,理解當刻背景、Agent 的意圖、實際採取的行動及背後思考原因,並即時評估該回合表現。之後當系統判斷用戶目標完成或對話結束,就會將多個相關回合整合成一個完整 Episode。
這個 Episode 會清楚記錄:用戶想達成甚麼目標、最後有無成功、成功或失敗原因,以及有甚麼做法值得下次再用、有甚麼陷阱應該避免。
建立 Episode 後,下一步就是學習。AgentCore 內的 Reflection Module 會定期檢索過往相似且成功的 Episode,然後跨多個案例作比較,嘗試歸納出可重複使用的策略。例如:某類問題通常用哪些工具最有效、甚麼情況下某種做法容易出錯等。
與單一 Episode 最大分別在於,Reflection 不會叫 Agent 照抄舊做法,而是提供策略層面提示。每一條 Insight 亦會附帶信心分數,令 Agent 知道這個結論在不同情境下的可靠程度。
兩種記憶其實各有強項。如果面對的是高度結構化、流程固定的問題,例如退款流程、航空改票、內部系統操作,Episode 提供的「逐步案例」往往最實用。
但如果場景比較開放,問題型態經常變更,例如數據分析、系統設計、複雜排錯,Reflection 提供的策略性指引會比單一案例更有價值。實際應用上,Agent 通常會先參考 Reflection 決定方向,再於遇到困難時翻查相關 Episode。
AgentCore 亦考慮到企業應用的彈性需求。開發團隊可以透過自訂 Prompt,調整記憶抽取與反思邏輯,例如決定哪些資料值得保存、如何處理矛盾經驗,或者反思應該產生多詳細的內容。
同時系統支援為不同階段揀選不同模型,方便在準確度同延遲之間作取捨。加上 Namespace 設計,企業可以按應用或用戶層級管理記憶,避免不相關經驗互相影響。
根據 AWS 公布的測試結果,加入 Episodic Memory 的 Agent,在零售同航空客戶服務場景中,無論成功率或一致性都明顯高過無記憶版本。
特別值得留意是高一致性指標(多次嘗試都成功)的提升最為明顯,反映 Episodic Memory 最大價值不只是「答對一次」,而是協助 Agent 避免偶發性錯誤。同時數據亦顯示,不同場景適合不同記憶策略:流程嚴謹的任務較受惠於 Episode,而互動多變的場景則更依賴 Reflection。
Episodic Memory 為 AI Agent 補上一塊關鍵拼圖。這令 Agent 不再只是即時推理工具,而是可以累積經驗、修正行為、隨時間變得更可靠的系統。
配合 Summarization、Semantic 及 Preference Memory,Amazon Bedrock AgentCore 正逐步建立一個更接近人類工作方式的 Agent 架構。對企業而言,這種會成長、會避免重複犯錯的 Agent,才真正有條件長期投入生產環境。