不再傻傻分不清 你想了解的人工智能這里都有
當(dāng)前,人工智能正在席卷全球科技產(chǎn)業(yè),越來越多的行業(yè)和市場都在人工智能領(lǐng)域進(jìn)行深耕,作為當(dāng)今輔助人類進(jìn)行創(chuàng)新和變革的重要生產(chǎn)力工具和技術(shù)驅(qū)動力,人工智能技術(shù)當(dāng)前已經(jīng)發(fā)展到什么階段了呢?未來人工智能產(chǎn)業(yè)又將會走向何方呢?本期我們一起來聊聊。
對于人工智能技術(shù)來說,我們?nèi)粘=?jīng)?吹降幕蛟S是機(jī)器算法的應(yīng)用、又或是對于自然語言的處理等內(nèi)容,對于人工智能來說,現(xiàn)在已經(jīng)收集了海量的最優(yōu)算法,其中涵蓋了計(jì)算機(jī)視覺、游戲、自然語言處理、網(wǎng)絡(luò)圖、知識庫等很多內(nèi)容。
計(jì)算機(jī)視覺感知
其中值得一提的是計(jì)算機(jī)視覺,對于計(jì)算機(jī)視覺來說,3D技術(shù)是最受青睞的一類,2017年的CVPR,MIT、馬薩諸塞大學(xué)阿默斯特分校和谷歌DeepMind的研究人員展示了一項(xiàng)成果,使用自動編碼器(VAE),構(gòu)建了一個(gè)名叫SingleVPNet的框架,能從多個(gè)視角的深度圖或其相應(yīng)的輪廓(silhouette)學(xué)習(xí)生成模型,并使用渲染函數(shù)從這些圖像生成細(xì)節(jié)精致的3D形狀。
對于計(jì)算機(jī)識別感知框架來說,通過一系列不同視角的2D深度圖當(dāng)中,研究人員就能夠去生成新的3D形狀和3D圖片,其中的平均誤差將會縮小到0.35左右,也就是說計(jì)算機(jī)視覺所帶來的3D圖片將會是非常逼真的一張圖。
動作識別
在人工智能領(lǐng)域當(dāng)中,動作識別是整個(gè)視頻識別當(dāng)中最為關(guān)鍵的一項(xiàng)組成部分,整個(gè)動作可能會貫穿視頻當(dāng)中,對于動作識別來說,很有可能成為圖像識別的重要組成部分,2017年的NeurIPS,CMU機(jī)器人學(xué)院的研究人員Rohit Girdhar 和 Deva Ramanan 利用注意力機(jī)制(Attentional Pooling),在保持網(wǎng)絡(luò)復(fù)雜度和計(jì)算量基本不變的情況下,在三個(gè)靜態(tài)圖像和視頻標(biāo)準(zhǔn)動作識別數(shù)據(jù)集上提升了動作識別的基準(zhǔn)。其中,在MPII人體姿態(tài)數(shù)據(jù)集上取得了12.5%的相對改進(jìn)。
人臉識別技術(shù)
在今年的市場研究數(shù)據(jù)報(bào)告顯示,在被譽(yù)為工業(yè)界“黃金標(biāo)準(zhǔn)”的全球人臉識別算法測試(FRVT)中,依圖科技以千萬分之一誤報(bào)下的識別準(zhǔn)確率超過99%,繼續(xù)保持全球人臉識別競賽冠軍。
千萬分位誤報(bào)下的識別準(zhǔn)確率超過99%,意味著更多核心關(guān)鍵的安防場景被解鎖。相比于去年同期,全球人臉識別性能提升了80%。在整個(gè)報(bào)告當(dāng)中對于很多國內(nèi)的人工智能企業(yè)進(jìn)行了重點(diǎn)的提及和展示,而中國的人工智能企業(yè)也的確在業(yè)務(wù)領(lǐng)域和技術(shù)創(chuàng)新方面領(lǐng)跑全球。
人體姿態(tài)數(shù)據(jù)分析
在今年的9月份,AlphaPose系統(tǒng)升級,采用PyTorch框架,在姿態(tài)估計(jì)標(biāo)準(zhǔn)測試集COCO validation set上,達(dá)到 71mAP的精度比OpenPose 相對提升17%,Mask-RCNN相對提升8%,同時(shí),速度達(dá)到了20FPS比OpenPose相對提高66%,Mask-RCNN相對提高300%。
圖像分類
計(jì)算機(jī)對于圖像處理來說其實(shí)早就已經(jīng)超越了人類的原有技術(shù)應(yīng)用,當(dāng)前圖像分類精度的最好成績,往往是其他研究的副產(chǎn)物。ICLR 2017,谷歌大腦 Barret Zoph 和 Quoc V. Le 發(fā)表了“Neural Architecture Search with Reinforcement Learning”,他們用強(qiáng)化學(xué)習(xí)自動搜索神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),最終AI自己設(shè)計(jì)出的模型,在 CIFAR-10數(shù)據(jù)集上做圖像分類取得了96.35%的精度。
GAN在今年不斷發(fā)展,今年ICLR DeepMind 提出的 BigGAN,可謂當(dāng)前最強(qiáng)圖像生成模型,在128x128分辨率的ImageNet上訓(xùn)練,BigGAN的 Inception 分?jǐn)?shù)(IS)可以達(dá)到 166.3 ,F(xiàn)rechet Inception 距離(FID)9.6。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動更多
推薦專題
- 1 腦機(jī)接口芯片,華為出了新專利!
- 2 今年諾獎(jiǎng)對人工智能的重視,給我們的基礎(chǔ)教育提了個(gè)醒
- 3 銀行業(yè)AI大模型,從入局到求變
- 4 巨頭搶布局,VC狂撒錢,為了能讓「AI讀心」這些公司卷瘋了
- 5 阿斯麥ASML:“骨折級”洋相,又成AI第一殺手?
- 6 蘋果市值創(chuàng)新高,iPhone 16能否助力突破4萬億美元大關(guān)?
- 7 一場“載入史冊”的發(fā)布會,讓馬斯克失去了4700億
- 8 百度谷歌比較研究2024:中美“遠(yuǎn)古AI龍頭”的現(xiàn)狀與趨勢
- 9 洞見AI風(fēng)潮 第二屆vivo藍(lán)河操作系統(tǒng)創(chuàng)新賽開啟招募
- 10 地平線開啟配售,阿里百度各砸5000萬美金,市值最高超500億
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市