一般來說,服務機器人“嘴巴”(人機對話系統)由6個功能模塊組成,其外形和系統 結構如圖2.5所示。
(1)語音識別模塊。該模塊將從音頻輸入設備中獲得的用戶語音信號所包含的詞匯 內容轉換為計算機可以讀的文本信息或命令。
(2)自然語言理解模塊。得到的文本信息或命令需要經過語言理解模塊的分析才能獲取用戶話語的語義信息,主要目的是將自然語言的表達形式轉換成計算機內部所表示 的形式化語言,然后經過計算和推導后獲取用戶的意圖。
(3)對話管理模塊。人機對話系統是用戶和計算機按照特定次序互相獲取對方信息 來完成特定任務的過程,此過程要對話管理模塊來進行有效的控制管理。其主要根據當 前用戶的話語信息,結合領域知識和對話歷史來確定用戶意圖,并決定系統下一步將要 采取的動作,如返回查詢結果,對用戶意圖的猜測詢問,出錯提示等。
(4)后臺服務處理模塊。該模塊完成系統的管理業務,例如數據庫查詢和管理等工 作。它在對話管理模塊的控制之下工作。
5)自然語言生成模塊。該模塊用來將系統輸出信息轉換成用戶可以理解的自然語言格式,將對話管理模塊輸出的詢問、確認、澄清、查詢結果信息等轉變成用戶能夠理解 的自然語言。
(6)語音生成模塊。語音生成也稱為語音合成,該技術是將自然語言文本格式轉換 成為語音格式,Z終以聲音的方式將處理結果輸 出給用戶。下面介紹幾個服務機器人“嘴巴”的 實例。
近年來,SCUT “智能計算機”科研團隊也對 聊天機器人展開了研究,如圖2.6所示。他們開 發的SCUT 聊天機器人包括攝像頭及驅動模塊、 語音拾取模塊、語音識別模塊、知識查詢模塊、語 音生成模塊;攝像頭捕獲人臉圖像,語音信號經 由語音拾取模塊和語音識別模塊后識別出語義,聊天機器人根據用戶的語音來了解用戶的需求,
然后通過知識查詢模塊來形成會話語句,再通過語音生成模塊生成語音與用戶進行交 流。該聊天機器具有語音識別和理解能力,它能夠聽懂用戶指令,可以應用于學校、家 庭、賓館、公司、機場、車站、碼頭、會議等地進行教育、聊天、會話、咨詢等服務;它還可以 為用戶提供宣傳介紹、來訪接待、辦事查詢、文秘服務、外語翻譯等。
日本日立公司也研制了一臺智能機器人EMIEW, 它的個頭和小孩一樣,依靠輪子移 動,如圖2.7(a)所示。由于身上裝有數碼相機和雷達探測器,它可以自動地躲避障礙物。 同時它的詞匯儲備量達到100多個,能夠對一些簡單的聲音指令做出反應,并且還能夠 和人進行簡單的對話交流,甚至播報天氣預報等。第二代 EMIEW2 機器人可以通過無 線電裝置接收指令,然后毫不費力地在辦公室之間來回奔波,為辦公室人員跑腿。它站 立時身高大約為31.5英寸,體重為29磅。它能夠對障礙物應付自如,對人的語音做出 回應,并且一次充電后即可工作1小時。此外,能說5國語言的機器人及與人對話的機 器人也已經誕生了,如圖2.7(b) 所示。在我國舉辦的日語演講大賽現場上,參加比賽的 選手以及日語院校的學生不但與該機器人進行了交流互動,而且該機器人還獻上了許多 精彩舞蹈和歌曲。
![]() |
機器人底盤 Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動機器人底盤 商用機器人 智能垃圾站 智能服務機器人 大屏機器人 霧化消毒機器人 展廳機器人 服務機器人底盤 具身智能教育機器人 智能配送機器人 導覽機器人 |