國產(chǎn)GPU“挑戰(zhàn)”美國禁令,創(chuàng)全球通用GPU最高算力
上個月,美國以維護(hù)國家安全為由,禁止英偉達(dá)、AMD向中國銷售AI芯片,引發(fā)市場熱議。但同時有專家指出,此舉給予中國廠商與相關(guān)產(chǎn)業(yè)崛起的機(jī)會,如同2015年美國政府發(fā)出禁令要求英特爾停止向中國超級計(jì)算機(jī)制造商出售高端芯片,因擔(dān)心中國用于核武研究,但僅僅一年后,中國便成功研發(fā)出用于超算的自主知識產(chǎn)權(quán)的國產(chǎn)芯片。
業(yè)內(nèi)人士認(rèn)為,美國禁止AI芯片銷往中國,是打擊超級計(jì)算機(jī)、高效能運(yùn)算以及AI等領(lǐng)域的措施之一,去年美國將7家超算企業(yè)及研發(fā)機(jī)構(gòu)列入“貿(mào)易黑名單”,如今又禁止英偉達(dá)、AMD向中國銷售AI芯片,未來不排除會擴(kuò)大制裁范圍。
然而,近日,非盈利性機(jī)器學(xué)習(xí)開放組織MLCommons聯(lián)盟發(fā)布報(bào)告指出,國產(chǎn)高端GPU芯片企業(yè)——壁仞科技的AI芯片擁有出色的效率,甚至超越其中一款被美國政府限制出售的AI芯片。
有專家認(rèn)為,這是里程碑的代表,國內(nèi)廠商獲得了額外的機(jī)會,因?yàn)樵S多客戶無法取得國外的芯片,而國內(nèi)廠商正在生產(chǎn)類似的產(chǎn)品。
【國產(chǎn)GPU賽道的“種子選手”】
據(jù)了解,壁仞科技創(chuàng)立于2019年,是國內(nèi)一家通用智能芯片的初創(chuàng)企業(yè),也是國產(chǎn)圖形GPU賽道的“種子選手”。截至目前,壁仞科技已完成B輪融資,總?cè)谫Y額超50億元人民幣。
今年4月,公司公布首款通用GPU芯片BR100系列,是首款面向云端AI訓(xùn)練集推理的通用GPU算力產(chǎn)品。
該系列芯片架構(gòu)完全由壁仞科技自主原創(chuàng)研發(fā),核心性能能夠直接對標(biāo)國際廠商近期發(fā)布的旗艦產(chǎn)品。消息稱,其峰值算力超過了英偉達(dá)目前在售的旗艦A100。
據(jù)了解,BR100芯片采用7nm制程、壁仞原創(chuàng)“壁立仞”芯片架構(gòu),容納近800億顆晶體管,配備超300MB片上高速SRAM,并應(yīng)用Chiplet與2.5D CoWoS封裝技術(shù),突破了大尺寸芯片制造與封裝中的光罩尺寸限制問題,做到高良率與高性能的兼顧。
總體而言,壁仞科技BR100最大的爆點(diǎn)在于單芯片1000TFLOPs,以及這是在550W功耗約束下的算力。在發(fā)布會上,壁仞科技創(chuàng)始人、董事長、CEO張文稱,中國通用GPU芯片進(jìn)入每秒1,000,000,000,0000,000次計(jì)算新時代。
BR100系列芯片將主要用于AI訓(xùn)練推理、通運(yùn)用算等場景,在智慧城市、云游戲、自動駕駛等領(lǐng)域都有很大的發(fā)揮空間。
據(jù)消息稱,壁仞的CTO是華為海思出身的洪洲,當(dāng)年海思推GPU,進(jìn)展很好,但是被美國制裁了,壁仞的技術(shù)團(tuán)隊(duì)還有不少技術(shù)才俊,包括曾創(chuàng)建高通公司驍龍GPU團(tuán)隊(duì)、領(lǐng)導(dǎo)了5代Adreno GPU架構(gòu)開發(fā)的首席架構(gòu)師焦國方,前阿里云AI基礎(chǔ)架構(gòu)負(fù)責(zé)人徐凌杰,海光前海外GPU部門副總裁張凌嵐,EDA軟件巨頭Synopsys(新思科技)前AI Lab負(fù)責(zé)人唐杉,AMD前全球副總裁、中國研發(fā)中心總經(jīng)理李新榮,英偉達(dá)前上海總經(jīng)理?xiàng)畛吹取?/p>
【BR104創(chuàng)造全球通用GPU最高算力】
近日,全球權(quán)威AI基準(zhǔn)評測MLPerf公布了最新AI基準(zhǔn)測試結(jié)果(MLPerf Inference v2.1)。壁仞科技以最新發(fā)布的通用GPU芯片BR104,拿下數(shù)據(jù)中心推理評測中自然語言理解(BERT模型)和圖像分類(ResNet50模型)兩類基準(zhǔn)評測“available”(可售產(chǎn)品類別)單卡性能全球第一的成績,其中BR104在BERT模型下達(dá)到了英偉達(dá)A100單卡性能的1.58倍。
據(jù)了解,MLPerf由圖靈獎得主大衛(wèi)·帕特森(David?Patterson)聯(lián)合谷歌、斯坦福大學(xué)、哈佛大學(xué)等共同成立,是國際上最權(quán)威、最有影響力的基準(zhǔn)測試之一。為及時跟蹤和評測迅速發(fā)展的AI計(jì)算需求與性能,MLPerf每年組織2次AI測試。其數(shù)據(jù)中心場景的評測,綜合考察參與廠商的硬件系統(tǒng)和軟件優(yōu)化能力,而此次BR104參加的“Closed Division”(固定任務(wù))類別,則要求參評者在完全一致的模型和環(huán)境下進(jìn)行性能結(jié)果的提交,因此這一類別下的結(jié)果被認(rèn)為是全球數(shù)據(jù)中心產(chǎn)業(yè)最具參考價值的AI性能基準(zhǔn)測試結(jié)果。
與此同時,在BERT模型下,BR104還拿下了4卡整機(jī)、8卡整機(jī)性能全球第一的成績,算力能效比也遠(yuǎn)遠(yuǎn)領(lǐng)先于其他廠商,達(dá)到英偉達(dá)A100算力能效比的2.11倍。BERT模型是目前自然語言理解領(lǐng)域應(yīng)用最廣泛的模型之一,也是相關(guān)產(chǎn)業(yè)應(yīng)用中最重要的模型。
壁仞科技董事長、創(chuàng)始人、CEO張文表示,ResNet50模型和BERT模型是目前產(chǎn)業(yè)客戶最重視的AI模型,此次MLPerf最新發(fā)布的評測結(jié)果,直接證明了BR100系列通用GPU芯片的落地應(yīng)用能力。目前,BR104已經(jīng)開始了大規(guī)模的客戶送測和適配,性能更強(qiáng)大的BR100也已啟動落地應(yīng)用,我們對BR100系列未來的應(yīng)用前景充滿信心。
【硝煙開始彌漫】
長期以來,全球GPU產(chǎn)業(yè)都被英偉達(dá)和AMD等美國企業(yè)所壟斷,在美國禁令的背景下,中國在技術(shù)領(lǐng)域“自給自足”的重要性愈發(fā)凸顯。
當(dāng)下,看到機(jī)會的不止是壁仞科技,除了早先入局的寒武紀(jì)、比特大陸、燧原科技等云端芯片創(chuàng)企外,過去一年間,陸續(xù)有新玩家現(xiàn)身,大量資本也正積極地涌入這一賽道。
分析機(jī)構(gòu)CCS Insight的分析師表示,壁仞科技已經(jīng)展現(xiàn)出實(shí)力,商機(jī)已經(jīng)落在他們身上,可能會因此獲得成功。此外,有分析師認(rèn)為,要在人工智能領(lǐng)域獲得成功,不僅是生產(chǎn)芯片,還需要一套與英偉達(dá)CUDA平臺競爭的完整的人工智能軟件生態(tài)系統(tǒng),而這挑戰(zhàn)難度極大。
眾所周知,英偉達(dá)的一個關(guān)鍵優(yōu)勢在于2006年發(fā)表的CUDA通用并行計(jì)算平臺和編程模型,讓GPU成為并行運(yùn)算的首選,如今已被開發(fā)者們大量使用。
壁仞科技CTO洪洲曾表示,新的GPU板卡要無縫地支持CUDA生態(tài),這比更高的算力,更好的能效比更重要。目前階段必須保證用CUDA寫的程序能無縫運(yùn)行在壁仞科技的異構(gòu)計(jì)算開發(fā)平臺上,不應(yīng)當(dāng)為了追求所謂的極致能效,而打破對通用編程模型的兼容性。
當(dāng)前壁仞科技的第一要務(wù)是在打造自有編程模型的同時,兼容CUDA當(dāng)前版本,而壁仞科技的終極目標(biāo),是提供比CUDA更好的自研編程模型。
國內(nèi)云端AI芯片及GPU賽道的硝煙正開始彌漫,入局者將越來越多。
畢竟,GPU, CPU, NPU, XPU國產(chǎn)化是這一代國人工程師的歷史使命,也是中國拿下電車,自動駕駛,物聯(lián)網(wǎng)這些蛋糕的前置條件。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月31日立即下載>> 【限時免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報(bào)名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報(bào)名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題