被華為天才少年帶火的AutoML,到底有多大“錢(qián)景”?
文/李信
編輯/子夜
華為天才少年鐘釗爆火后,AutoML也順勢(shì)獲得了廣泛關(guān)注。
AutoML(Automated Machine Learning,自動(dòng)化人工智能),通俗來(lái)說(shuō)就是讓AI去學(xué)習(xí)AI,從而減少人工的參與,讓機(jī)器完成更復(fù)雜的工作。
在鐘釗來(lái)到華為工作之前,華為諾亞方舟實(shí)驗(yàn)室已經(jīng)在進(jìn)行AutoML方向的相關(guān)研究。在這基礎(chǔ)之上,鐘釗團(tuán)隊(duì)實(shí)現(xiàn)了業(yè)內(nèi)首個(gè)AutoML大規(guī)模商用。
鐘釗本人也在知乎上親自回應(yīng)了最近的熱議。他表示“手機(jī)拍照?qǐng)F(tuán)隊(duì)第一次做大規(guī)模驗(yàn)證的業(yè)務(wù)。簡(jiǎn)單說(shuō)是計(jì)算攝影/AI-ISP,就是用AI方法對(duì)RAW圖處理,來(lái)替換加強(qiáng)傳統(tǒng)圖像處理的過(guò)程。這個(gè)是端側(cè)功耗和速度要求最高的任務(wù),一方面我們有DXO評(píng)分(DXOMARK,評(píng)估智能手機(jī)鏡頭與相機(jī)的商業(yè)測(cè)評(píng)網(wǎng)站)和消費(fèi)者效果的壓力,另一方面要維持消費(fèi)者的是否卡頓和發(fā)熱基礎(chǔ)體驗(yàn)!
鐘釗在知乎回應(yīng),圖源知乎截圖
盡管鐘釗在知乎上表示“自己并不是天才,這個(gè)title帶來(lái)了許多壓力。還是希望能低調(diào)一點(diǎn),真正做點(diǎn)我喜歡的事情”,但他進(jìn)入華為正是通過(guò)“天才少年”計(jì)劃被招募進(jìn)去的。
2019年,華為創(chuàng)始人任正非發(fā)起“天才少年”計(jì)劃,旨在吸引頂尖人才。鐘釗正是被招募而來(lái)的首批“天才少年”,目前華為已招募17名“天才少年”。鐘釗入職后,正是作為AutoML研究組的領(lǐng)導(dǎo),帶領(lǐng)團(tuán)隊(duì)研究相關(guān)應(yīng)用。
據(jù)連線Insight了解,AutoML其實(shí)已經(jīng)發(fā)展多年,國(guó)內(nèi)外其他科技企業(yè),在AutoML技術(shù)上也有了相關(guān)成果。谷歌在2018年推出了AutoML Vision平臺(tái),百度也有專(zhuān)門(mén)的AutoML平臺(tái)——EasyDL,阿里、騰訊等企業(yè)也在AutoML領(lǐng)域有不同的研究方向與應(yīng)用。
從商業(yè)價(jià)值來(lái)看,AutoML可以應(yīng)用在各行各業(yè),這也是國(guó)內(nèi)外科技企業(yè)紛紛入局的重要原因。
華為天才少年,只是揭開(kāi)了AutoML大規(guī)模商用的序幕,今后在其他領(lǐng)域或能看見(jiàn)更多AutoML應(yīng)用的場(chǎng)景。
1、華為天才少年,帶火了AutoML
一位天才少年,讓AutoML技術(shù)一夜成名。
據(jù)近期華為內(nèi)刊《華為人》在一篇文章提到,首批“天才少年”鐘釗,在入職不到一年的時(shí)間里,與團(tuán)隊(duì)將AutoML技術(shù)應(yīng)用到了數(shù)千萬(wàn)臺(tái)華為手機(jī)上,做到了在業(yè)界第一次將AutoML大規(guī)模商用的突破。
據(jù)鐘釗在自述中提到,他入職后第一個(gè)任務(wù)就是研究如何用算法彌補(bǔ)光學(xué)的不足,以此實(shí)現(xiàn)手機(jī)拍照超越單反拍照的效果。
“手機(jī)拍照的競(jìng)爭(zhēng)力一直是手機(jī)產(chǎn)品線關(guān)注的重點(diǎn)。由于手機(jī)上的光源器件很小,但是又需要它達(dá)到單反相機(jī)的效果,所以我們部門(mén)一直在努力研究如何用算法來(lái)彌補(bǔ)光學(xué)的不足,實(shí)現(xiàn)手機(jī)拍照超越單反拍照的效果!辩娽撛谧允鲋刑岬健
從描述中可以看到,手機(jī)拍照的效果要想超越單反拍照,實(shí)現(xiàn)難度可想而知,但這就是鐘釗團(tuán)隊(duì)接到的任務(wù)。
公開(kāi)資料顯示,在2019年,華為M系列手機(jī)決定要上線鐘釗所在團(tuán)隊(duì)的一個(gè)重要的拍照算法,當(dāng)時(shí)M系列手機(jī)拍照算法包含有一個(gè)很大的AI模型。盡管拍照效果不錯(cuò),但在功耗、出圖速度上一直無(wú)法達(dá)到產(chǎn)品交付標(biāo)準(zhǔn),進(jìn)而嚴(yán)重影響了整個(gè)產(chǎn)品的交付進(jìn)度。
此時(shí)鐘釗所在的團(tuán)隊(duì),必須要解決這一問(wèn)題,保證產(chǎn)品的交付進(jìn)度。而當(dāng)時(shí)鐘釗的導(dǎo)師,也就是所在部門(mén)最頂級(jí)的專(zhuān)家建議用AutoML技術(shù)來(lái)解決這個(gè)難題。
從純技術(shù)角度來(lái)看,AutoML技術(shù)既可以保證拍照出圖效果,又能將算法簡(jiǎn)化,滿足產(chǎn)品功耗、速度等指標(biāo)要求。
但關(guān)鍵問(wèn)題是,此前關(guān)于功耗、速度等難題,早就有眾多算法專(zhuān)家研究過(guò),但一直沒(méi)能完全解決,初出茅廬的鐘釗與團(tuán)隊(duì)人員能夠解決嗎?
在鐘釗的自述中,他提到當(dāng)時(shí)不僅學(xué)術(shù)界沒(méi)有任何公開(kāi)的將AutoML應(yīng)用在像素級(jí)任務(wù)上的研究,更不用說(shuō)是直接商用AutoML的樣例了。
為此,鐘釗與團(tuán)隊(duì)人員是跨過(guò)了學(xué)術(shù)研究,直接將基礎(chǔ)研究與商用落地同時(shí)進(jìn)行了,通過(guò)商用實(shí)戰(zhàn)來(lái)使用AutoML這個(gè)最新技術(shù),“可以說(shuō)是在一邊打仗一邊造武器”。
具體做了哪些工作,鐘釗也在知乎上親自進(jìn)行了回答。他提到早期工作主要是用AutoML自動(dòng)進(jìn)行各種成像模型壓縮加速,同時(shí)針對(duì)華為自研的麒麟芯片,基于硬件在環(huán)反饋,做自動(dòng)化的模型親和設(shè)計(jì),所以最終的模型會(huì)和市面上的常見(jiàn)模型有許多細(xì)節(jié)不同。這個(gè)問(wèn)題的難點(diǎn)在于不能降低效果,對(duì)功耗和速度要求又特別高,同時(shí)還沒(méi)有很有效的評(píng)價(jià)方法。
2019年,鐘釗團(tuán)隊(duì)希望整個(gè)AutoML應(yīng)該從自動(dòng)造數(shù)據(jù)集,覆蓋到最后的量化階段。也就是通過(guò)AutoML技術(shù)在保證拍照出圖效果的前提下,把算法簡(jiǎn)化下來(lái),滿足產(chǎn)品功耗、速度等指標(biāo)的要求。
事實(shí)證明,鐘釗團(tuán)隊(duì)商用實(shí)戰(zhàn)的效果獲得了不錯(cuò)的突破,如今AutoML這套拍照系統(tǒng)或者說(shuō)算法在華為M、P系列多款手機(jī)中實(shí)現(xiàn)了不可替代的作用,這一技術(shù)也應(yīng)用到了數(shù)千萬(wàn)臺(tái)華為手機(jī)。
華為P50 Pro拍攝的圖片,圖源華為官網(wǎng)
據(jù)華為表示,AutoML技術(shù)已成為部門(mén)的核心公共能力,也支持了視頻、ARVR、河圖等眾多媒體的關(guān)鍵業(yè)務(wù)。
鐘釗也在知乎上表示,目前,很多技術(shù)還沒(méi)有完全商用,后續(xù)華為手機(jī)視頻效果還有待繼續(xù)提升。
這位華為天才少年,可謂將AutoML技術(shù)徹底帶火了。
2、AutoML還有哪些應(yīng)用空間?
追溯AutoML的起源,最早源自2012年學(xué)術(shù)界提出的一個(gè)新觀念——Programming by Optimization(PbO),意思為最優(yōu)化程序開(kāi)發(fā),但實(shí)際上這是解決程序開(kāi)發(fā)時(shí)人工調(diào)校參數(shù)的問(wèn)題,即將這部分工作交由機(jī)器來(lái)做。
理論上,如果機(jī)器可以自行調(diào)校參數(shù),的確可以大幅度解放人力,進(jìn)而讓人力去干更具有創(chuàng)造性的工作。但如何讓機(jī)器擁有自我調(diào)校的能力,這是一個(gè)難題。
為此,AutoML的概念提出后,一直沒(méi)有太多聲響。直到在2018年谷歌云全球NEXT大會(huì)上,谷歌云人工智能和機(jī)器學(xué)習(xí)首席科學(xué)家李飛飛宣布谷歌AutoML Vision進(jìn)入公共測(cè)試版,并推出了兩款新的AutoML產(chǎn)品:AutoML Natural Language和AutoML Translation。
這兩款產(chǎn)品的基本原理是可以用AI設(shè)計(jì)AI,讓更多對(duì)機(jī)器學(xué)習(xí)了解有限的人,將Google的AI技術(shù)運(yùn)用到產(chǎn)品打磨中,從而降低使用機(jī)器學(xué)習(xí)的門(mén)檻。
具體來(lái)講,AutoML Natural Language可以解析文本的結(jié)構(gòu)和意義,可用于從文本文檔、新聞或博文中提取有關(guān)人物、地點(diǎn)、事件等信息。AutoML Translation則可以使用最新的神經(jīng)機(jī)器翻譯技術(shù)將字符串翻譯成任何支持的語(yǔ)言。
也就是從這時(shí)開(kāi)始,AutoML在更大的范圍內(nèi)被世人所知。
Google AutoML發(fā)布后,業(yè)內(nèi)將其稱之為Google Cloud發(fā)展的戰(zhàn)略轉(zhuǎn)型。這是因?yàn)橐恢币詠?lái)面向機(jī)器學(xué)習(xí)人工智能開(kāi)發(fā)者的Google Cloud,現(xiàn)在開(kāi)始服務(wù)更為廣大的人群了。
簡(jiǎn)單來(lái)說(shuō),Google AutoML是開(kāi)發(fā)“利器”。即使是一個(gè)對(duì)人工智能不太懂的人,在Google AutoML平臺(tái)上,上傳標(biāo)簽數(shù)據(jù)后,也能得到一個(gè)定制化的機(jī)器學(xué)習(xí)模型。而從導(dǎo)入數(shù)據(jù)到標(biāo)記,最后訓(xùn)練模型完成,都可以通過(guò)拖放界面完成。
當(dāng)時(shí),Google AutoML的服務(wù)僅支持計(jì)算機(jī)視覺(jué)模型,但谷歌表示后續(xù)會(huì)支持所有標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)模型,包括語(yǔ)音、翻譯、視頻、自然語(yǔ)言處理等。
其實(shí),在谷歌發(fā)布Google AutoML時(shí),迪士尼等企業(yè)已經(jīng)在測(cè)試這項(xiàng)服務(wù)。
迪士尼消費(fèi)產(chǎn)品和互動(dòng)媒體CTO及高級(jí)副總裁Mike White曾提到:“Cloud AutoML的技術(shù)能幫我們創(chuàng)建計(jì)算機(jī)視覺(jué)模型,根據(jù)迪士尼的角色、產(chǎn)品類(lèi)別和顏色來(lái)標(biāo)注我們的產(chǎn)品,這些標(biāo)注可以整合到我們的搜索引擎中,在shopDisney商店中通過(guò)更相關(guān)的搜索結(jié)果、更快地發(fā)現(xiàn)速度和產(chǎn)品推薦,來(lái)加強(qiáng)用戶體驗(yàn)!
此外,服裝品牌Urban Outfitters也在嘗試使用Google AutoML服務(wù),優(yōu)化客戶購(gòu)物體驗(yàn)。
一般來(lái)說(shuō),服飾品牌產(chǎn)品屬性多樣,這就導(dǎo)致消費(fèi)者選擇空間很大,而為了能根據(jù)消費(fèi)者需求推薦相關(guān)產(chǎn)品,以及輸出準(zhǔn)確的搜索結(jié)果。Urban Outfitters此前需要?jiǎng)?chuàng)建和維護(hù)一組極其細(xì)致的產(chǎn)品屬性列表,而通過(guò)Google AutoML,可以通過(guò)識(shí)別花紋、領(lǐng)口樣式等細(xì)微差別,自動(dòng)將產(chǎn)品歸類(lèi),幫助消費(fèi)者更好的發(fā)現(xiàn)適合自己的產(chǎn)品。
可以看到,AutoML的應(yīng)用場(chǎng)景極為廣泛,不僅可以在視覺(jué)領(lǐng)域進(jìn)行應(yīng)用,還可在語(yǔ)音、視頻、搜索等領(lǐng)域發(fā)揮所長(zhǎng)。
據(jù)谷歌云人工智能研發(fā)負(fù)責(zé)人李佳曾在博客中透露,目前AutoML的注冊(cè)用戶也已經(jīng)超過(guò)1.8萬(wàn)家,服務(wù)行業(yè)橫跨媒體、零售、金融、保險(xiǎn)、能源、醫(yī)療、環(huán)境等。同時(shí),AutoML超過(guò)10%的用戶來(lái)自醫(yī)療和生命醫(yī)學(xué)行業(yè),產(chǎn)品也推動(dòng)了用戶在醫(yī)療影像輔助檢測(cè),以及推動(dòng)了哮喘、嬰兒猝死綜合征方面的創(chuàng)新。
目前來(lái)看,AutoML可以應(yīng)用在各行各業(yè),只不過(guò)由于當(dāng)前技術(shù)原因,暫時(shí)只適用于某些領(lǐng)域。而AutoML的應(yīng)用前景如此廣闊,自然也吸引了國(guó)內(nèi)外的科技企業(yè)紛紛入局。
3、 國(guó)內(nèi)還有哪些企業(yè)在研發(fā)AutoML?
AutoML作為AI技術(shù)中的一份子,其發(fā)展自然也緊跟時(shí)代的步伐。
今年6月,知名數(shù)據(jù)公司IDC中國(guó)發(fā)布《中國(guó)AI公有云服務(wù)市場(chǎng)研究報(bào)告-2020》,該報(bào)告顯示,2020年中國(guó)AI公有云服務(wù)整體市場(chǎng)規(guī)模達(dá)24.1億元人民幣,占比整體AI軟件市場(chǎng)10.4%。預(yù)計(jì)到2025年,中國(guó)AI軟件市場(chǎng)公有云服務(wù)占比將達(dá)到36.1%。
2020年中國(guó)AI公有云服務(wù)市場(chǎng)格局上,百度智能云、阿里云、騰訊云、華為云位居前四。在產(chǎn)品上,各大廠商陸續(xù)推出各個(gè)技術(shù)領(lǐng)域的自學(xué)習(xí)平臺(tái),作為不同形式的AutoML產(chǎn)品。
百度多年以來(lái)在AI領(lǐng)域的積累,也終于發(fā)揮了重要作用。從報(bào)告來(lái)看,百度智能云在國(guó)內(nèi)AI公有云服務(wù)市場(chǎng)份額最高,其AI應(yīng)用全面開(kāi)花、多行業(yè)落地。
百度旗下的AutoML平臺(tái)名為“EasyDL”,不同于傳統(tǒng)意義上的AutoML,EasyDL是一個(gè)專(zhuān)門(mén)針對(duì)深度學(xué)習(xí)模型訓(xùn)練與發(fā)布的平臺(tái)。而且在EasyDL平臺(tái)之前,百度已經(jīng)有深度學(xué)習(xí)計(jì)算引擎 PaddlePaddle,這是一個(gè)專(zhuān)業(yè)級(jí)計(jì)算平臺(tái),目標(biāo)群體為具有一定計(jì)算機(jī)與算法基礎(chǔ)的專(zhuān)業(yè)AI算法工程師。
此外,百度還有AI開(kāi)放平臺(tái),用戶可以根據(jù)平臺(tái)提供的API(應(yīng)用程序接口)付費(fèi)調(diào)用百度的AI算法能力,以此實(shí)現(xiàn)自己的需求。但是AI開(kāi)放平臺(tái)的算法模型無(wú)法覆蓋全領(lǐng)域場(chǎng)景,這就導(dǎo)致很多企業(yè)的定制化需求無(wú)法被滿足。
EasyDL的技術(shù)方向,圖源EasyDL官網(wǎng)
基于此,百度推出了EasyDL平臺(tái),目的是為了解決AI賦能行業(yè)的痛點(diǎn),以及滿足企業(yè)定制化深度學(xué)習(xí)模型的需求。當(dāng)前,該平臺(tái)有經(jīng)典版、專(zhuān)業(yè)版和零售版,提供圖像識(shí)別、文本分類(lèi)、聲音分類(lèi)、視頻分類(lèi)等服務(wù)分類(lèi)。
據(jù)百度EasyDL官方顯示,當(dāng)前已經(jīng)攜手90多萬(wàn)用戶,服務(wù)20多個(gè)行業(yè)場(chǎng)景,在零售、醫(yī)療、農(nóng)業(yè)、工業(yè)等領(lǐng)域得到廣泛應(yīng)用。
從技術(shù)與應(yīng)用范圍來(lái)看,百度的EasyDL平臺(tái)在國(guó)內(nèi)外科技企業(yè)中都能夠排在前列。而阿里、騰訊等國(guó)內(nèi)知名科技企業(yè)也不甘落后,均推出了相關(guān)服務(wù)。
阿里云機(jī)器學(xué)習(xí) PAI(Platform of Artificial Intelligence)就是一站式的機(jī)器學(xué)習(xí)平臺(tái),其中PAI 提供了從模型自動(dòng)調(diào)參到一鍵部署,再到線上的流式計(jì)算服務(wù)等一系列的工業(yè)級(jí)模型部署方案。PAI-AutoML也支持幾種調(diào)參方法,如自定義參數(shù)、網(wǎng)格搜索、隨機(jī)搜索以及進(jìn)化算法等,也支持不同情況下的調(diào)參需求。
PAI 自動(dòng)調(diào)參這一功能,既可以讓不清楚算法原理的入門(mén)者也能進(jìn)行部署,也解放了資深算法工程師的時(shí)間,其自定義調(diào)參功能替代了工程師在細(xì)節(jié)參數(shù)上的重復(fù)性勞動(dòng)。
除了大廠之外,國(guó)內(nèi)獨(dú)立AI公司也推出了AutoML平臺(tái),如第四范式對(duì)AutoML算法進(jìn)行了產(chǎn)品化封裝,推出了一款自動(dòng)化AI生產(chǎn)力平臺(tái)Sage HyperCycle ML。
在第四范式的介紹中,其表示HyperCycle ML將原本繁瑣的機(jī)器學(xué)習(xí)應(yīng)用構(gòu)建過(guò)程提煉為行為、反饋、學(xué)習(xí)和應(yīng)用四個(gè)步驟,用戶只需完成簡(jiǎn)單的配置,即可輕松啟動(dòng)一個(gè)自動(dòng)機(jī)器學(xué)習(xí)圈的持續(xù)學(xué)習(xí)和預(yù)估服務(wù),實(shí)現(xiàn)了業(yè)務(wù)人員也可以用的AI產(chǎn)品。
當(dāng)前,第四范式的HyperCycle ML平臺(tái)主要應(yīng)用在精準(zhǔn)營(yíng)銷(xiāo)、逾期預(yù)測(cè)、反欺詐、反洗錢(qián)等領(lǐng)域,客戶則大多為中國(guó)工商銀行、廣發(fā)銀行等銀行為主。
在華為天才少年爆火之前,國(guó)內(nèi)外科技企業(yè)其實(shí)早已在研究AutoML技術(shù),并且將其應(yīng)用在了各個(gè)領(lǐng)域。
或許,我們現(xiàn)在使用的某個(gè)互聯(lián)網(wǎng)服務(wù)背后,AutoML正在發(fā)揮著無(wú)可取代的作用。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車(chē)
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
推薦專(zhuān)題
- 1 【一周車(chē)話】沒(méi)有方向盤(pán)和踏板的車(chē),你敢坐嗎?
- 2 特斯拉發(fā)布無(wú)人駕駛車(chē),還未迎來(lái)“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 海信給AI電視打樣,12大AI智能體全面升級(jí)大屏體驗(yàn)
- 6 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 7 馬斯克致敬“國(guó)產(chǎn)蘿卜”?
- 8 神經(jīng)網(wǎng)絡(luò),誰(shuí)是盈利最強(qiáng)企業(yè)?
- 9 比蘋(píng)果偉大100倍!真正改寫(xiě)人類(lèi)歷史的智能產(chǎn)品降臨
- 10 諾獎(jiǎng)進(jìn)入“AI時(shí)代”,人類(lèi)何去何從?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專(zhuān)家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市