訂閱
糾錯(cuò)
加入自媒體

AI虛擬主播“小靈”背后有哪些秘密?

今年“五四運(yùn)動(dòng)”迎來(lái)一百年的生日,在中央廣播電視總臺(tái)主題為“我們都是追夢(mèng)人”的 2019《五月的鮮花》五四晚會(huì)上為其獻(xiàn)上一份“新鮮”大禮,百度大腦AI虛擬主持人小靈首次亮相。作為“新新”青年的代表,小靈在舞臺(tái)上賺足了眼球,既能通過(guò)人臉識(shí)別技術(shù)與嘉賓互動(dòng),又有極強(qiáng)地控場(chǎng)能力。

小靈作為3D立體虛擬主持人,糅合了百度大腦的語(yǔ)音、視覺、大數(shù)據(jù),以及AR等多重技術(shù),其中最引人注目的是“唇動(dòng)技術(shù)”。小靈的唇動(dòng)技術(shù),基于大量的面部特征數(shù)據(jù)學(xué)習(xí),輔之以人工智能和深度學(xué)習(xí)技術(shù)而形成的。小靈優(yōu)秀的主持功力背后,究竟有哪些技術(shù)作為支撐呢?虛擬主持人將會(huì)有多大的發(fā)展前景呢?接下來(lái)我們細(xì)細(xì)剖析!

“小靈”臺(tái)上一分鐘,AI幕后做了哪些“十年功”?

小靈在從漫天飛舞的鮮花中走出來(lái),站在主持人小尼和王俊凱中間熱情地與觀眾互動(dòng),活動(dòng)過(guò)程中能夠發(fā)表自己的觀點(diǎn),看似簡(jiǎn)單的行為,背后少不了海量的數(shù)據(jù)支持和超強(qiáng)的人工智能技術(shù)運(yùn)用。

首先,不得不提小靈的“唇動(dòng)技術(shù)”。人說(shuō)話嘴唇會(huì)自然而然地跟著運(yùn)動(dòng),我們習(xí)以為常的事情對(duì)于AI虛擬主持人便沒有那么簡(jiǎn)單了。小靈想要達(dá)到能夠在說(shuō)話的時(shí)候像人一樣自如地開合嘴唇,她一定要做好充足的準(zhǔn)備。第一項(xiàng)準(zhǔn)備事宜便是面部數(shù)據(jù)的搜集,每一項(xiàng)人工智能技術(shù)的產(chǎn)生都需要大量的數(shù)據(jù)作為基石;趯(duì)海量的面部數(shù)據(jù)進(jìn)行深度學(xué)習(xí)加之語(yǔ)音合成技術(shù),便形成了我們看到的人工智能虛擬主持人“小靈”在晚會(huì)上能夠“真實(shí)唇動(dòng)”。

其次,人臉識(shí)別技術(shù)更是現(xiàn)場(chǎng)最大的亮點(diǎn)。在與主持人小尼互動(dòng)的時(shí)候,小尼想借用00后愛看的動(dòng)畫片來(lái)掩蓋自己的真實(shí)年齡時(shí),小靈并沒有“上當(dāng)”。小靈通過(guò)人臉識(shí)別技術(shù)采集了小尼的人臉信息,并利用知識(shí)圖譜清楚地知道小尼的年齡。在小尼企圖用《喜羊羊與灰太狼》來(lái)欺騙小靈時(shí),小靈迅速運(yùn)用自己的“超級(jí)大腦”知識(shí)圖譜來(lái)反駁他說(shuō),《黑貓警長(zhǎng)》、《葫蘆兄弟》才真正屬于他的年代。人臉識(shí)別+知識(shí)圖譜的技術(shù)讓小靈能夠在現(xiàn)場(chǎng)做到隨機(jī)應(yīng)變,與此同時(shí)人臉識(shí)別技術(shù)還運(yùn)用到了與嘉賓互動(dòng)的環(huán)節(jié)。今年晚會(huì)上有一個(gè)有趣的測(cè)“花”活動(dòng),小靈通過(guò)人臉識(shí)別技術(shù)便可測(cè)出你是什么“花”。

除了人臉識(shí)別技術(shù),還有AR、大數(shù)據(jù)、語(yǔ)音識(shí)別等技術(shù)運(yùn)用在小靈身上!芭_(tái)上一分鐘,臺(tái)下十年功”,小靈雖然第一次登臺(tái),卻能夠落落大方、對(duì)答如流離不開各類AI技術(shù)的成熟與靈活配合。

AI虛擬主持人究竟能走多遠(yuǎn)?

其實(shí),小靈并不是首位AI人工智能主持人,在今年兩會(huì)期間搜狗與新華社聯(lián)合推出的“新小萌”和科大訊飛推出了“小晴”兩位人工智能虛擬主持人。兩會(huì)期間推出的兩款均可以找到原型,如新華社推出的“新小萌”是以新華社主播曲萌為原型。這類虛擬主持人通常是真人輸入語(yǔ)音,隨后對(duì)聲音進(jìn)行標(biāo)注和機(jī)器進(jìn)行深度學(xué)習(xí),以此構(gòu)建出其發(fā)音聲學(xué)模型,在此基礎(chǔ)上,輸入任何文本便可進(jìn)行語(yǔ)音合成,進(jìn)而實(shí)現(xiàn)在線播報(bào)。本次五四晚會(huì)亮相的“小靈”是以二次元形象示眾,沒有明確的原型可以尋覓。與此同時(shí)小靈需要在舞臺(tái)上與其他主持人和嘉賓互動(dòng),和在線播報(bào)相比,小靈不僅要運(yùn)用到語(yǔ)音識(shí)別的技術(shù)還要具備能夠在短時(shí)間內(nèi)進(jìn)行大數(shù)據(jù)運(yùn)算的能力。對(duì)于虛擬主持人來(lái)說(shuō),技術(shù)發(fā)展有了進(jìn)一步的提升,但很多人依舊存在疑惑,虛擬主播要來(lái)?yè)尅安ヒ魡T”的飯碗嗎?

人工智能作為一項(xiàng)通用技術(shù),可以為了各行各業(yè)出現(xiàn)的問題提供解決辦法,對(duì)于主持人行業(yè)來(lái)說(shuō)也不例外。首先,虛擬主播可以節(jié)省大量人力成本?拼笥嶏w推出的“小晴”精通多種語(yǔ)言,可以在中文、日語(yǔ)、英語(yǔ)、韓語(yǔ)等多種語(yǔ)言中隨意切換,并且發(fā)音準(zhǔn)確,十分專業(yè)。如何能夠?qū)⒃擁?xiàng)技術(shù)可以廣泛普及,在對(duì)外宣傳的節(jié)目中,專業(yè)、標(biāo)準(zhǔn)的發(fā)音能夠極大地提高傳播效果。此外,虛擬主播能夠在惡劣的環(huán)境中完成播報(bào)。眾所周知在各大事件發(fā)生時(shí),記者總是要沖在第一線,掌握最新信息播報(bào)給大眾,但優(yōu)勢(shì)環(huán)境過(guò)于惡劣或者人力難以到達(dá)的時(shí)候,虛擬主播或許能夠派上用場(chǎng)。在戰(zhàn)火紛飛的戰(zhàn)場(chǎng)通過(guò)無(wú)人機(jī)獲取最新情況后,虛擬主播可以實(shí)時(shí)播報(bào)新聞;地震、洪水等自然災(zāi)害發(fā)生后,記者難以最先達(dá)到事故發(fā)生區(qū),虛擬主播便有了用武之地。

虛擬主播隨著人工智能技術(shù)的不斷發(fā)展,可以不斷解決行業(yè)內(nèi)存在的問題。至于虛擬主播究竟能不能取代人類的擔(dān)憂,依舊是“杞人憂天”。人工智能技術(shù)是讓人類可以從繁雜、無(wú)聊的工作中解脫出來(lái),而不是取代人類,真正有創(chuàng)造性的工作依舊需要人類自己完成。

1  2  下一頁(yè)>  
聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)