當前位置：首頁 > 新聞資訊 > 人工智能應用 > 多輪對話的基本原理：采用 RTC 技術低延遲雙全工人機對話,LLM 函數調用或結構化輸出連接后端系統

多輪對話的基本原理：采用 RTC 技術低延遲雙全工人機對話,LLM 函數調用或結構化輸出連接后端系統

來源：聲網研究院編輯：創澤時間：2025/11/21 主題：其他 [加盟]

對話式 AI 的核心職責是聽懂人類講話的內容和情感，并以語音對話的方式作出回應，然后重復這個循環。

當前，幾乎所有的J聯對話式 AI 產品都普遍采用相似的架構：對話式 AI Agent 服務部署于云端，協調端到端語音對話（Speech-to-Speech）的交互閉環，整體采用 RTC 技術實現超低延遲雙全工人機對話。支持行業主流 AI 模型接入，并通過 LLM 函數調用或結構化輸出連接后端系統。

整個循環流程如下：

◇ 用戶設備麥克風捕獲語音信號，編碼后經實時傳輸網絡傳輸至云端代理程序

◇ 將用戶語音實時轉換（ASR）為高準確率的文字，作為 LLM 的輸入

◇ 文本被整合為上下文提示（Prompt），由大語言模型（LLM）進行推理生成響應。

◇ LLM 生成的文本發送至文本轉語音（TTS）模型合成音頻

◇ 合成音頻通過實時傳輸網絡傳回用戶設備完成交互

對話式 AI 的整個服務全部在云端運行，包括 ASR、LLM 和 TTS。從長遠來看，人們期望有更多的 AI 服務可以在端側運行，但云端仍是未來很長一段時間的Z佳方案。

◇ 對話式 AI 程序需調用高性能模型（ASR、LLM、TTS）以實現低延遲的復雜流程。當前終端設備算力不足，無法在可接受延遲內運行Z優模型。

◇ 當前，仍有大量商用場景用戶是需要通過電話進行呼叫的，在此類場景中，服務無法部署到用戶的終端設備上，也迫使服務集中于云端。

◇ 對話式 AI 需要跨終端使用，也導致云端部署成為Z高效的方案。

如果你正在開發一個對話式 AI 產品或應用，你可能已經發現對話式 AI 并沒有想象中的簡單，我們會面臨并思考以下問題：

◇ 對話式 AI 該選擇哪些大語言模型和 TTS？

◇ 如何降低人機對話的端到端延遲？

◇ 如何讓 AI 對話與人類一樣自然？

◇ 如何在長會話中管理對話上下文？

◇ 如何將對話式 AI 集成到現有應用中？

◇ 如何評估對話式 AI 的性能表現？

老年人陪伴機器人關注的重點：表達能力＞理解能力

聲音和表達方式是否溫暖、自然、有情感,且語速、音量是否適合老年用戶 ,能夠理解老人的話語及隱含情感,交互的流暢舒適比絕對速度更重要

2025對話式AI發展白皮書-技術模塊,產品方案及生態,對話體驗質量評估方法,應用實踐落地等發展現狀與未來趨勢

系統地梳理了對話式 AI 的發展現狀與未來趨勢,為行業打造了一本可落地的實踐指南,開啟了人與 AI 互動的新紀元，硬件、教育、社交等各個領域的應用場景也隨之而來加速裂變

AI工具深度測評與選型指南V1-5大類別 - 39個AI工具 - 92個實例測評

文本生成與處理類AI工具測評：代碼生成,文案創作,長文摘要,專業問答等核心能力;圖像生成與編輯類AI工具測評：語音合成質量,音色調節,視頻生成效果等

2025基于DeepSeek的詳細規劃智能管控體系創新與實踐-智能助手‌ 編制‌ 審查‌ 管理‌

基于AI知識庫的嵌入式集成應用,實現全場景業務需求的準確響應;智能識別審查標準,形成標準化的審查知識庫,提高審查效率;智能選址,規劃條件生成、低效用地篩查等高效推進城市發展落地的應用

以DeepSeek為代表的AI在能源行業的應用前景預測-精準預測風光發電功率,實時監測與故障診斷

精準預測風光發電功率（如某省電網棄光率從19%降至3.2%，預測精度達94.7%）;省間新能源交易電量1711億千瓦時（+22.5%）;零售市場用戶達114.9萬家，售電公司5229家

DeepSeek驅動下的地圖生成-構建地圖智能體實現自動化制圖,虛實融合場景生成

利用LLM工具（如DeepSeek、ChatGPT）構建地圖智能體，集成知識圖譜與數據工具，實現自動化制圖;結合GAN/GCN生成符合制圖規則的地圖,賦能智慧城市、游戲娛樂等新興領域

DeepSeek核心技術白話解讀-學習策略創新，模型結構創新，五段位進階指南

萬億Token訓練時間壓縮至3.7天;動態8位浮點量化提升訓練速度30%;優化計算效率與負載均衡，突破傳統Transformer限制;文生圖/圖生文任務中仍需提升生成準確性

DeepSeek應用場景梳理-理論+實踐的結合，智能化轉型的實戰指導手冊

通過理論+實踐的結合，展現了DeepSeek作為新一代AI技術在產業升級和個人效能提升中的關鍵作用，是智能化轉型的實戰指導手冊

DeepSeek等大模型工具使用手冊-實戰篇:文本類,圖片類,語音類,視頻類應用實踐,在輔助編程中的應用

如何通過DeepSeek進行文本生成、文檔處理等操作;介紹圖片類AIGC的定義和應用場景;視頻類AIGC應用實踐列舉國內外代表性的視頻類AIGC大模型

疾控工作者應該怎么利用DeepSeek等Al大模型-輿情監測預警智能體、疫情預測與傳播模擬智能體等

疾控領域包括輿情監測預警智能體、疫情預測與傳播模擬智能體等;具體場景包括醫防協同信息通‌ 監測分析‌ 預警預測‌ 風險評估‌ 流行病學調查‌ 應急處置‌ 免疫規劃‌ 監督執法‌

從DeepSeek爆火看2025年AI的發展-具備邏輯推理能力,重新定義算法優化邊界

一是神經符號系統融合，或讓 AI 具備邏輯推理能力;二是量子計算實用化，或重新定義算法優化邊界;AI 領域快速變革,推動 AI 技術更好發展

內蒙古DeepSeek模型地方政府部署進展

實現城市大腦與DeepSeek大語言模型的初步集成;與“根數據庫”應用平臺實現互聯互通;本地化私有部署DeepSeek-R1模型，推動其與12345熱線結合

亚洲成a人片在线观看高清丨欧美内射rape视频丨国产热の有码热の无码视频丨五月综合激情婷婷六月色窝丨国产欧美国日产高清

多輪對話的基本原理：采用 RTC 技術低延遲雙全工人機對話,LLM 函數調用或結構化輸出連接后端系統

老年人陪伴機器人關注的重點：表達能力＞理解能力

2025對話式AI發展白皮書-技術模塊,產品方案及生態,對話體驗質量評估方法,應用實踐落地等發展現狀與未來趨勢

AI工具深度測評與選型指南V1-5大類別 - 39個AI工具 - 92個實例測評

2025基于DeepSeek的詳細規劃智能管控體系創新與實踐-智能助手‌ 編制‌ 審查‌ 管理‌

以DeepSeek為代表的AI在能源行業的應用前景預測-精準預測風光發電功率,實時監測與故障診斷

DeepSeek驅動下的地圖生成-構建地圖智能體實現自動化制圖,虛實融合場景生成

DeepSeek核心技術白話解讀-學習策略創新，模型結構創新，五段位進階指南

DeepSeek應用場景梳理-理論+實踐的結合，智能化轉型的實戰指導手冊

DeepSeek等大模型工具使用手冊-實戰篇:文本類,圖片類,語音類,視頻類應用實踐,在輔助編程中的應用

疾控工作者應該怎么利用DeepSeek等Al大模型-輿情監測預警智能體、疫情預測與傳播模擬智能體等

從DeepSeek爆火看2025年AI的發展-具備邏輯推理能力,重新定義算法優化邊界

內蒙古DeepSeek模型地方政府部署進展

服務機器人(迎賓、講解、導診...)

智能消毒機器人

機器人底盤

多輪對話的基本原理：采用 RTC 技術低延遲雙全工人機對話,LLM 函數調用或結構化輸 出連接后端系統

服務機器人(迎賓、講解、導診...)

智能消毒機器人

機器人底盤

多輪對話的基本原理：采用 RTC 技術低延遲雙全工人機對話,LLM 函數調用或結構化輸出連接后端系統