上下文管理是對話式 AI 的記憶中樞,需通過技術方案(RAG、結構化記憶)與優化策略 (意圖過濾、動態裁剪)解決連貫性、資源消耗與準確性的三角平衡問題。
聲網對話式 AI 引擎采用的方案是通過結構化短期記憶+動態長期記憶注入,在保障兼容性的同時,針對實時語音交互場景(尤其中斷處理)進行深度優化,并賦予開發者高度靈 活的上下文控制權限。
短期記憶(Short-term Memory)是智能體在當前會話中臨時保存和處理的信息空間。 用戶和對話式智能體互動期間,智能體會在短期記憶中緩存當前對話的上下文,確保智能體 能夠連貫地理解和回應用戶的連續輸入。
對話式 AI 引擎整體短期記憶會以 JSON 的形式存儲,遵循 OpenAI Chat Completions 的規則,同時進行了部分的擴展。
◇ 智能體運行期間,調用 GET 獲取智能體短期記憶接口獲取短期記憶 JSON。該接 口會得到智能體生命周期內儲存的完整的短期記憶。
◇ 智能體停止后,聲網會通過消息通知服務將短期記憶回調至你的業務服務器,詳見 消息通知事件類型。
智能體的短期記憶會隨智能體停止而消失,你可以在智能體停止后,將短期記憶儲存到 你的服務器以固化為長期記憶,之后在創建智能體時通過 llm.system_messages 直接注入 原始記憶內容或經過總結的記憶內容,從而實現在智能體退出或重啟后仍然能夠訪問和使用 這些數據。
以下示例展示了通過 system_messages 注入經過總結的記憶內容:

![]() |
| 商用機器人 Disinfection Robot 展廳機器人 智能垃圾站 輪式機器人底盤 迎賓機器人 移動機器人底盤 講解機器人 紫外線消毒機器人 大屏機器人 霧化消毒機器人 服務機器人底盤 智能送餐機器人 霧化消毒機 機器人OEM代工廠 消毒機器人排名 智能配送機器人 圖書館機器人 導引機器人 移動消毒機器人 導診機器人 迎賓接待機器人 前臺機器人 導覽機器人 酒店送物機器人 云跡科技潤機器人 云跡酒店機器人 智能導診機器人 |