訂閱
糾錯(cuò)
加入自媒體

商湯科技AI+3D能否成為AI行業(yè)變革新引擎?

AI+3D,一項(xiàng)具有革命性改變的感知技術(shù),正在慢慢向工業(yè)生產(chǎn)、硬件制造,以及人們?nèi)粘I顫B入。

3D感知硬件能夠提供距離、深度等數(shù)據(jù)信息,但這并不是單純的數(shù)據(jù),而是基于這些數(shù)據(jù),通過不同的表達(dá)和理解方式,實(shí)現(xiàn)不同的應(yīng)用。比如對三維場景進(jìn)行數(shù)字化建模,或者繪制三維地圖,從而讓機(jī)器能夠?qū)崟r(shí)感知自己在所處空間中的位置,以便在運(yùn)動(dòng)時(shí)及時(shí)避開障礙物等。

這需要根據(jù)深度信息生成深度圖像,并與RGB圖像,甚至是紅外圖像進(jìn)行融合并完成大量計(jì)算。

而商湯科技向筆者表示,通過硬件感知信息生成的深度圖像,往往存在因硬件性能限制而產(chǎn)生瑕的疵。例如在細(xì)小或復(fù)雜交錯(cuò)的物體之間,出現(xiàn)深度信息估計(jì)錯(cuò)誤等問題。此外,精準(zhǔn)度、魯棒性、實(shí)時(shí)性、效率等都是決定實(shí)際應(yīng)用效果的關(guān)鍵。這些問題和應(yīng)用效果都需要依靠額外的算法進(jìn)行實(shí)時(shí)處理予以彌補(bǔ)和增強(qiáng)。

據(jù)悉,AI可通過對大量實(shí)際數(shù)據(jù)進(jìn)行學(xué)習(xí),自行總結(jié)其中的規(guī)律和特征。這種方法可以在短時(shí)間內(nèi),完成傳統(tǒng)算法需要多年才能突破的問題,有效彌補(bǔ)硬件能力的不足。

3D硬件小型化,是3D視覺技術(shù)應(yīng)用場景拓展和創(chuàng)新的硬件基礎(chǔ),而AI技術(shù)則是真正的動(dòng)力引擎,兩者密不可分。在商湯科技看來,AI+3D視覺技術(shù)拐點(diǎn)已至。

什么是AI+3D?

初次接觸,可能很多人,對于AI+3D這項(xiàng)技術(shù)有些陌生。但實(shí)際上,了解之后便會(huì)發(fā)現(xiàn),就如前文所說“AI+3D是一項(xiàng)最新的感知技術(shù)”。3D屬于成像技術(shù),是靠人兩眼的視覺差產(chǎn)生的;跀z像頭獲取的圖像信息,視覺技術(shù)可以搭配AI技術(shù)解決各種實(shí)際應(yīng)用問題。

這些深度圖像信息則可以豐富AI圖像視覺技術(shù),如同人眼一樣對場景深度進(jìn)行感知。商湯科技向筆者稱:“對于AI來說,能像人類一樣獲得深度信息后的感知能力,是他們研究這項(xiàng)課題的想法。行業(yè)早些年研究結(jié)構(gòu)光、ToF、雙攝等基于硬件設(shè)備技術(shù)都是為了帶來深度信息,搭配AI對3D圖像的感知能力,豐富不同領(lǐng)域的應(yīng)用”。

ToF技術(shù)與結(jié)構(gòu)光技術(shù)對比(以手機(jī)行業(yè)為例)

同時(shí),光鑒科技首席執(zhí)行官朱力認(rèn)為:“3D視覺技術(shù)的意義,是打開了更加廣闊的AI應(yīng)用空間。無論是輔助駕駛,還是各種虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)技術(shù)的應(yīng)用,這些前沿概念的落地都建立在信息交互基礎(chǔ)上。對正處于發(fā)展中的AI產(chǎn)業(yè)來說,3D視覺將幫助機(jī)器更好地“看”世界”。

據(jù)筆者了解,隨著硬件設(shè)備的小型化,AI+3D技術(shù)及其成熟的解決方案,可在手機(jī)應(yīng)用、人臉識(shí)別、AR/VR領(lǐng)域、汽車、工業(yè)等具有相關(guān)性領(lǐng)域進(jìn)行研發(fā)和場景落地。

例如:通用3D重建技術(shù),從毛絨玩具、紙箱、書包、鞋子到雕塑,用戶只需拿手機(jī)沿著物體360度環(huán)繞掃描,就能將其掃描成數(shù)字化的模型。生成的模型文件可直接用于3D打印、3D/AR相冊預(yù)覽,也可應(yīng)用于生成短視頻直播的內(nèi)容并設(shè)置動(dòng)畫,也可植入到AR養(yǎng)寵等游戲、電商的商品展示或預(yù)覽等場景中。

除此,在汽車領(lǐng)域,AI+3D技術(shù)能夠?qū)崿F(xiàn)更加精準(zhǔn)的人、車、物識(shí)別和距離感知,從而有力推動(dòng)自動(dòng)駕駛發(fā)展。在工業(yè)領(lǐng)域,AI+3D將進(jìn)一步優(yōu)化工業(yè)生產(chǎn)流程,可為機(jī)械臂賦予3D感知能力,通過高精準(zhǔn)的SLAM、物體重建和測量等技術(shù),判斷立體物體所處的位置,以及相應(yīng)尺寸、形狀和質(zhì)量等信息,提升工業(yè)生產(chǎn)智能化能力。

目前,商湯科技已在人臉識(shí)別、汽車、工業(yè)、電商、手機(jī)等領(lǐng)域進(jìn)行了深入研究。

AI+3D能否成為AI業(yè)又一“強(qiáng)心劑”

人工智能作為第四次工業(yè)革命的產(chǎn)物之一,給社會(huì)、工業(yè)、人帶來的是一場人機(jī)交互變革。與此同時(shí)在該產(chǎn)業(yè)也誕生了許多新興企業(yè),如:商湯科技、寒武紀(jì)、曠視科技、云從科技、同盾科技等估值達(dá)到或超過10億美元的AI企業(yè)。

按照產(chǎn)業(yè)鏈,從底層硬件到上層的應(yīng)用,整個(gè)AI+3D產(chǎn)業(yè)鏈可以分為四類廠商,在國內(nèi)外均有企業(yè)在進(jìn)行相應(yīng)的開發(fā):一、3D感知硬件設(shè)備的相關(guān)供應(yīng)商,包括鏡頭、攝像頭模組、圖像傳感器,以及紅外光源等器件;二、基于3D感知的AI技術(shù)/算法提供商;三、手機(jī)廠商,將AI+3D軟硬件技術(shù)進(jìn)行整合;四、應(yīng)用開發(fā)商,開發(fā)基于AI+3D技術(shù)的應(yīng)用。

很多AI企業(yè)則屬于第二類:基于3D感知的AI技術(shù)/算法提供商。

而本次AI+3D技術(shù)的應(yīng)用和產(chǎn)業(yè)鏈延伸更是將AI行業(yè)發(fā)展推向高潮。國外調(diào)研機(jī)構(gòu)QYResearch曾預(yù)測,全球3D技術(shù)市場規(guī)模2012年為796億美元,至2022年將達(dá)到3892億美元,年復(fù)合增長率為17.20%。

商湯科技認(rèn)為,“ToF在智能手機(jī)上的加速應(yīng)用,有助于3D視覺技術(shù)的廣泛普及化,會(huì)成為接下來10年中非常重要的科技趨勢。業(yè)內(nèi)統(tǒng)計(jì),2019年TOF新機(jī)出貨約0.5億臺(tái),預(yù)估2020年將達(dá)到1.5億臺(tái)”。

在筆者看來,AI+3D技術(shù)所產(chǎn)生的價(jià)值則是對以往機(jī)器2D視覺認(rèn)知的更新迭代或替代,可以讓機(jī)器通過視覺三維影像,更加智能化,對所處世界有一個(gè)較為全面且深刻的信息感知與理解。從人機(jī)交互、互動(dòng)娛樂、內(nèi)容創(chuàng)作、身份驗(yàn)證、拍照、電商等層面激發(fā)大量的創(chuàng)新應(yīng)用場景。改變傳統(tǒng)商業(yè)運(yùn)作模式。

不過,目前除了商湯科技外,谷歌、微軟、曠視科技在AI+3D技術(shù)方面也有研究。據(jù)曠視科技云事業(yè)部高級(jí)副總裁吳文昊介紹稱,“該技術(shù)已在手機(jī)領(lǐng)域有多種案例出來,但包含算法和模組的整體解決方案仍是缺位,公司正在嘗試一種從上往下的整合方案,從3D應(yīng)用層往下依次至AI算法、解決方案,最后到攝像、傳感等硬件設(shè)備制造上”。

另有行業(yè)人士認(rèn)為:“AI技術(shù)可以讓3D打印實(shí)現(xiàn)以機(jī)器制造機(jī)器人,這也是新一輪制造業(yè)革命的助推劑”。

作者:珍珍

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請輸入評(píng)論內(nèi)容...

請輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)