訂閱
糾錯
加入自媒體

國內(nèi)AI領先技術,語音識別未來的發(fā)展趨勢是怎樣的?

聲明:本文為火石創(chuàng)造原創(chuàng)文章,歡迎個人轉發(fā)分享,網(wǎng)站、公眾號等轉載需經(jīng)授權。

語音識別是發(fā)展未來人工智能(點擊閱讀:我國人工智能產(chǎn)業(yè)現(xiàn)狀及發(fā)展前景分析)的重要組成部分之一,是達到人機交互目的第一步,簡單來說,是機器或程序完成接受口令、解釋聲音含義、理解和執(zhí)行口頭指令所需的技術。本文將從行業(yè)政策環(huán)境、產(chǎn)業(yè)鏈、行業(yè)競爭格局、投資現(xiàn)狀等角度來剖析語音識別產(chǎn)業(yè)的發(fā)展現(xiàn)狀。

01行業(yè)政策環(huán)境

近年來,隨著科技的進步,人工智能這一新興領域取得了快速發(fā)展,相關政策相繼出臺。

表1:人工智能相關政策匯總

來源:火石創(chuàng)造根據(jù)公開資料整理

在“十四五”的大背景和智能經(jīng)濟形態(tài)下,目前已有多個省市響應中央號召,相繼發(fā)布人工智能相關規(guī)劃或?qū)m椪?以人工智能為技術手段,發(fā)揮當?shù)禺a(chǎn)業(yè)集群優(yōu)勢,促進產(chǎn)學研融合及協(xié)同發(fā)展。同時,語音識別技術屬于中國AI領域中最為成熟落地的技術之一,預計未來能夠繼續(xù)加速在各垂直行業(yè)進行滲透和布局。

02產(chǎn)業(yè)鏈分析

圖1:語音識別產(chǎn)業(yè)圖譜來源:火石創(chuàng)造根據(jù)公開資料整理

中國人工智能語音識別產(chǎn)業(yè)鏈主要分為上游、中游、下游。

上游:基礎層技術提供算力與數(shù)據(jù)方面的強力支持——包含算力與AI數(shù)據(jù)服務。語音識別模型在運行過程中訓練數(shù)據(jù)量和計算量需求極大,由于傳統(tǒng)的CPU或者單一處理器進行語音識別運算的處理時間過長,所以無法滿足海量數(shù)據(jù)計算的實時性需求。目前,主流語音識別公司的模擬訓練和語音識別基本都在云端采用GPU等計算芯片并行架構或異構計算方案進行。

中游:技術層提供理論與技術支撐——包含基礎理論技術以及算法模型相關解決方案的形成,升級為相關軟硬件產(chǎn)品。

下游:應用層提供技術落地應用場景——包含企業(yè)端、消費端、其他端場景。其中,企業(yè)端主要應用于醫(yī)療、公檢法等;消費端主要應用于智能家居、智慧教育等。

03行業(yè)競爭格局

中國的人工智能語音識別主流廠商大致可分為互聯(lián)網(wǎng)IT廠商、語音技術廠商兩類;ヂ(lián)網(wǎng)IT廠商典型包括阿里巴巴、騰訊、搜狗、百度等。這類廠商重視以流量導向和滿足龐大用戶群體驗和創(chuàng)新需求為導向去做AI開發(fā),更多以流量和用戶體驗為導向,同時,會比傳統(tǒng)的語音技術廠商更加注重創(chuàng)新實踐。語音技術廠商典型包括科大訊飛、捷通華聲等擁有自身核心語音芯片以及相關軟件系統(tǒng)的傳統(tǒng)語音技術廠商,還有云知聲、思必馳等側重于某些垂直領域的語音技術和產(chǎn)品的創(chuàng)業(yè)廠商。在眾多廠商中,科大訊飛、騰訊、百度為典型競爭力代表。

科大訊飛:科大訊飛是國內(nèi)領先的智能語音技術主要提供商之一,在語音識別等智能語音技術領域擁有國際先進的成果,主要業(yè)務包含智能語音和語言技術研究、軟件及芯片產(chǎn)品開發(fā)、語音信息服務及電子政務系統(tǒng)集成,為企業(yè)、政府和個人提供智能應用。科大訊飛技術優(yōu)勢在同行業(yè)中出眾,擁有自主知識產(chǎn)權的智能語音技術,推出覆蓋大型電信級應用到小型嵌入式應用以及滿足不同應用環(huán)境的軟硬件產(chǎn)品?拼笥嶏w在中文語音技術市場和語音合成產(chǎn)品市場都占有較大份額,應用于電信、金融、電力、社保等主流行業(yè)?拼笥嶏w結合自己核心的智能語音技術和人工智能的研究,已經(jīng)實現(xiàn)AI產(chǎn)品化的布局。在To B端,科大訊飛面向教育、政法、醫(yī)療、汽車和客服等多個行業(yè)提供相應的解決方案。在To C端,科大訊飛提供面向消費者的家庭、汽車、翻譯等個人消費品,包括硬件產(chǎn)品如訊飛學習機、訊飛翻譯機、智能辦公本等,以及軟件產(chǎn)品如訊飛輸入法、AI電視助手等。

騰訊:騰訊云語音識別目前主要應用于微信、王者榮耀、騰訊視頻等內(nèi)部業(yè)務,外部應用布局于錄音質(zhì)檢、會議實時轉寫、法庭及審訊記錄、語音輸入法等場景。技術提供主要功能為開放實時語音識別、一句話識別和錄音文件識別,支持云端和嵌入式兩種服務模式。騰訊云語音識別的主要優(yōu)勢在于有大量的用戶基礎和數(shù)據(jù)積累可應用于豐富的行業(yè)場景,收費價格較低,自準率高達97%,支持多語言識別能力,有領先的算法。

百度:百度在AI開放平臺上提供語音識別的技術,共享AI領域的應用場景和解決方案,產(chǎn)品包括短語音識別、實時語音識別、遠場語音識別、音頻文件轉寫、語音自訓練平臺等,應用于手機應用如語音輸入、機器人對話、語音內(nèi)容分析和實時語音轉寫等場景。百度的語音識別技術優(yōu)勢在于領先的語音識別技術,提供自助訓練專屬模型,可簡單快速地接入API及多種SDK接口,提供穩(wěn)定性保障,且收取費用較低。

04投資現(xiàn)狀

國內(nèi)人工智能產(chǎn)業(yè)發(fā)展較國外發(fā)展較晚,直至2011年方才展露出發(fā)展苗頭。語音識別作為人工智能產(chǎn)業(yè)中極其重要的一個組成部分,擔任著人機交互應用時的輸入和輸出接口,也相應地受到產(chǎn)業(yè)風口的影響,受到一眾投資機構的追捧。截至2021年2月,語音識別行業(yè)投資事件達150多件,投資金額達180億元左右。

圖2:我國語音識別產(chǎn)業(yè)投融資情況

來源:信通院

從投資輪次來看,A輪階段的語音識別企業(yè)更受資本方的青睞,投資額達50.24億元,投資事件達65次;其次,B、C、D、E輪次的投資相對平均;值得一提的是,對于早期項目,投資機構雖然單筆投資金額較少,但投資事件相對較高,達24次。按照語音識別產(chǎn)業(yè)分輪次投融資占比來看,行業(yè)中吸引了絕大部分資金的企業(yè)基本上都聚集在A、B、C輪。

圖3:我國語音識別產(chǎn)業(yè)分輪次投融資情況來源:融中研究

圖4:我國語音識別產(chǎn)業(yè)分輪次投融資占比情況來源:融中研究

從語音識別產(chǎn)業(yè)內(nèi)企業(yè)產(chǎn)品/服務應用方向來看,主要分為技術服務、教育、汽車交通、新工業(yè)、智能硬件、醫(yī)療、金融等幾個分類。其中,最為獲得投資機構青睞的是技術服務方向的語音識別企業(yè),占據(jù)了投資金額及投資事件數(shù)的絕大部分,分別為116.49億元、89次投資。值得一提的是,語音識別技術應用于汽車交通行業(yè)所獲得的投資件數(shù)雖然僅有4次,但單筆投資金額卻是最高的。

圖5:我國語音識別產(chǎn)業(yè)分行業(yè)投融資情況來源:融中研究

圖6:我國語音識別產(chǎn)業(yè)分行業(yè)投融資占比情況來源:融中研究

04總結

我國大力推動新基建發(fā)展,其中5G、人工智能、云計算等作為輔助核心基礎設施也將得到進一步加速發(fā)展,同時也會帶動語音識別產(chǎn)業(yè)迎來更加廣闊的發(fā)展空間。未來,相信在國家政策的強力扶持與供應商和開發(fā)者的共同努力下,語音識別產(chǎn)業(yè)會加速在垂直行業(yè)進行滲透和布局,能夠更好地與其他語音交互技術及軟件功能融合,為消費者提供更優(yōu)質(zhì)的體驗。

參考文獻1. 《AI語音識別行業(yè)發(fā)展研究報告》.融資中國2. 《語音識別技術市場狀況和發(fā)展歷程》旺龍智能.2021.5.

—END—    作者 | 火石創(chuàng)造 金丹 審核 | 火石創(chuàng)造邵錢、殷莉編輯 | 火石創(chuàng)造 張艷玲運營 | 火石創(chuàng)造 黃淑萍

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號