MLPerf公布首輪AI推理基準(zhǔn)測試結(jié)果,平頭哥含光800單芯片推理性能第一
11月7日報道
北京時間11月7日,MLPerf基準(zhǔn)聯(lián)盟公布首輪AI推理基準(zhǔn)測試結(jié)果,阿里巴巴平頭哥的AI芯片含光800在Resnet50基準(zhǔn)測試中獲得單芯片性能第一。
MLPerf 推理基準(zhǔn)測試設(shè)有五個基準(zhǔn),每個對應(yīng)四種場景,重點面向圖像分類、對象檢測和機器翻譯等常見機器學(xué)習(xí)任務(wù)。測試者可以選擇提交任何基準(zhǔn)及相應(yīng)場景的結(jié)果。
含光800參加了適用于圖像分類任務(wù)的Resnet50v1.5基準(zhǔn)測試,在離線模式(Offline mode)、服務(wù)模式(Servermode)、多路模式(Multi stream mode)和單路模式(Single stream mode)四個場景都取得了單芯片第一的成績。
離線模式測試的是芯片推理的最大吞吐量,最能考驗芯片的計算、存儲、通信等基本功。含光800的成績?yōu)?9306.60IPS,單芯片性能是谷歌TPUv3的8.5倍、Nvidia T4的12倍。
MLPerf是業(yè)內(nèi)首套衡量機器學(xué)習(xí)軟硬件性能的通用基準(zhǔn),由圖靈獎得主David?Patterson聯(lián)合谷歌和幾所著名高校于2018年發(fā)起。
MLPerf基準(zhǔn)聯(lián)盟現(xiàn)有50多家成員,包括谷歌、微軟、Facebook、阿里巴巴等企業(yè)和斯坦福、哈佛、多倫多大學(xué)等高校。
繼AI訓(xùn)練基準(zhǔn)v0.5、v0.6之后,MLPerf在今年6月推出AI推理基準(zhǔn)v0.5。參加本輪推理基準(zhǔn)測試并提交結(jié)果的公司共14家,谷歌(TPUv3)、英偉達(dá)(T4、RTX、Xavier)、英特爾(CLX 9282、NNPI-1000)、Habana(Goya)等呈現(xiàn)了當(dāng)前AI推理系統(tǒng)最高水平的競逐。
今年9月問世的含光800是阿里巴巴第一款正式流片的AI芯片,基于臺積電12nm工藝生產(chǎn),其性能突破得益于軟硬件的協(xié)同設(shè)計:采用平頭哥自研架構(gòu),有效降低內(nèi)存訪問延時;集成達(dá)摩院的創(chuàng)新算法,深度優(yōu)化CNN及視覺類算法,大幅提升視覺計算效率。
含光800主要用于云端視覺場景,現(xiàn)已大規(guī)模應(yīng)用于阿里巴巴集團內(nèi)多個場景,如視頻圖像識別/分類/搜索、城市大腦等,未來還可應(yīng)用于醫(yī)療影像、自動駕駛等領(lǐng)域。
今后,含光800的算力將通過阿里云對外輸出。
作者:郭亞鑫來源:獵云網(wǎng)
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月31日立即下載>> 【限時免費下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市