訂閱
糾錯(cuò)
加入自媒體

語言技術(shù):AI皇冠上的明珠

新技術(shù)未來的發(fā)展軌跡

在語音識(shí)別、語義理解和語音合成領(lǐng)域,它們?nèi)〉眠M(jìn)步的主要原因是引入深度學(xué)習(xí),更加依賴機(jī)器學(xué)習(xí)可能對(duì)語音領(lǐng)域的研究有更大的幫助。

處理多語言支持伴隨著不同的語法規(guī)則,這也是目前主要的挑戰(zhàn)之一,語音處理模型必須考慮并適應(yīng)這些語法規(guī)則,大多數(shù)自然語言處理模型采集句子,進(jìn)行詞性標(biāo)注在某種意義上識(shí)別語法,并創(chuàng)建規(guī)則來確定如何解釋該語法。

機(jī)器學(xué)習(xí)以及自然語言處理技術(shù)的進(jìn)步,開啟了人與人工智能進(jìn)行語音交互的可能,人們透過對(duì)話的方式獲取信息、與機(jī)器進(jìn)行交互,將不再只是存在科幻情結(jié)當(dāng)中。語音交互是未來的方向,而智能音箱則是語音交互落地的第一代產(chǎn)品。

AI對(duì)話所需要的技術(shù)模塊有4個(gè)部分,分別為:

自動(dòng)語音識(shí)別(ASR)自然語言理解(NLU)自然語言生成(NLG)文字轉(zhuǎn)語音(TTS)。

AI芯天下丨語音語言技術(shù)-AI皇冠上的明珠

一次完整的語音交互流程,成功的語音對(duì)話,通常是有以下幾個(gè)階段。

意圖:交互流程的核心

所謂意圖,表示用戶在使用應(yīng)用時(shí)所做的動(dòng)作(譬如:?jiǎn)栆粋(gè)問題或發(fā)送一條指令),這些意圖代表了應(yīng)用的核心功能。

如果應(yīng)用成功地識(shí)別了用戶意圖,則需要在完成業(yè)務(wù)動(dòng)作后,將結(jié)果反饋給用戶;如果應(yīng)用無法識(shí)別用戶意圖,則需要給用戶友好的提示,指導(dǎo)用戶使用。

如何識(shí)別意圖語:解析

對(duì)語音識(shí)別結(jié)果進(jìn)行分析理解,簡(jiǎn)單來說就是將用戶語音輸入映射到機(jī)器指令。它可能定義了一組包含指定的單詞或短語的語法結(jié)構(gòu),用戶通過說出滿足這種結(jié)構(gòu)的語句,來調(diào)用意圖。

云端交互:如何處理意圖

調(diào)用意圖的結(jié)構(gòu)化請(qǐng)求,向服務(wù)器請(qǐng)求處理后做出反饋響應(yīng)。通俗來講該流程主要處理用戶的請(qǐng)求,解決用戶問題的答案。

對(duì)話管理:上下文意圖的處理

在用戶進(jìn)行自然對(duì)話時(shí),可能會(huì)因?yàn)楸磉_(dá)事情的復(fù)雜度、時(shí)間、地點(diǎn)、效率等,產(chǎn)生具有脈絡(luò)的對(duì)話過程,所有的對(duì)話元素會(huì)編織在一個(gè)連貫的線性對(duì)話中。

組織語言:語言合成模塊

根據(jù)解析模塊得到的內(nèi)部表示,在對(duì)話管理機(jī)制的作用下生成自然語言句子。同時(shí)將生成模塊生成的句子轉(zhuǎn)換成語音輸出。

AI芯天下丨語音語言技術(shù)-AI皇冠上的明珠

語音技術(shù)在未來將大展宏圖

未來,科技創(chuàng)新將使人類的交流與溝通提升到另外一個(gè)層次,它不僅僅是幫助語言障礙患者進(jìn)行無障礙交流;還會(huì)在人與人或人與機(jī)器之間進(jìn)行信息交換。

由于人類語言的多樣化,限制了人與人之間的溝通,特別是跨國(guó)別和跨語種的交流。近幾年,隨著實(shí)時(shí)翻譯技術(shù)的成熟,語言鴻溝正被慢慢地消除。

各種便攜式翻譯設(shè)備可以幫助游客在幾秒鐘內(nèi)進(jìn)行語言翻譯。未來,小小的耳機(jī)設(shè)備將打破出行的語言限制,而傳統(tǒng)的翻譯這一職業(yè)也將被新技術(shù)所替代。

利益于人工智能技術(shù)的飛速發(fā)展,機(jī)器不僅僅是充當(dāng)翻譯人員,還可以成為溝通伙伴。據(jù)Gartner預(yù)測(cè),到今年年底,我們與新技術(shù)的互動(dòng)中有30%將通過與智能機(jī)器完成。

無論是在醫(yī)療、旅游、還是商業(yè)活動(dòng),以人工智能為代表的新技術(shù)正在徹底改變?nèi)伺c人之間的交流方式,并將打破身體、地域、國(guó)別、語種的各種限制。未來,我們的交流對(duì)象也將不再局限在人類,可以是機(jī)器、可以是動(dòng)物。

不過目前的語音識(shí)別仍處于起步階段。與期望相比,語音技術(shù)的應(yīng)用還處在滿足基本需求的階段,并且有很大的上升空間。

AI芯天下丨語音語言技術(shù)-AI皇冠上的明珠

結(jié)尾

當(dāng)我們?cè)谡Z音技術(shù)的推動(dòng)下向前邁進(jìn)時(shí),世界應(yīng)該擁抱它所創(chuàng)造的充滿希望的人文精神。即使是類人機(jī)器人,它們能做的也只是笨拙地移動(dòng),使用語言是人類這個(gè)物種真正與眾不同的地方。

語音技術(shù)為世界帶來了新的力量和便利性,如果應(yīng)對(duì)得當(dāng),語音技術(shù)有可能成為最有感情的技術(shù)。認(rèn)為人工智能只能是冷冰冰的算法的觀點(diǎn)是錯(cuò)誤的,人類可以將最好的價(jià)值觀和同理心注入其中。

<上一頁  1  2  
聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)