未來(lái)的大模型,或許都是A卡來(lái)算的?
前言:
當(dāng)前,算力中心領(lǐng)域正面臨一個(gè)重要趨勢(shì),即隨著部分大型模型制造商逐漸減少對(duì)預(yù)訓(xùn)練的依賴,對(duì)推理能力和模型微調(diào)的需求顯著增加。
這一變化對(duì)下游大型模型和應(yīng)用開發(fā)商產(chǎn)生了深遠(yuǎn)影響,進(jìn)而促使上游芯片制造商迅速調(diào)整戰(zhàn)略方向。
然而,僅僅依靠單一芯片的差異化競(jìng)爭(zhēng)已難以滿足市場(chǎng)需求。
作者 | 方文三
圖片來(lái)源 | 網(wǎng) 絡(luò)
AMD新品直接對(duì)標(biāo)英偉達(dá)Blackwell系列芯片
AMD公司在舊金山舉辦的Advancing AI 2024盛會(huì)上,其首席執(zhí)行官蘇姿豐推出了全新一代的Ryzen CPU、Instinct AI計(jì)算卡以及EPYC AI芯片等系列產(chǎn)品。
這些產(chǎn)品全面覆蓋了AI計(jì)算領(lǐng)域,并明確針對(duì)英偉達(dá)公司的Blackwell系列芯片展開競(jìng)爭(zhēng)。
據(jù)國(guó)際媒體報(bào)道,過(guò)去幾年中,英偉達(dá)在數(shù)據(jù)中心GPU市場(chǎng)中占據(jù)了顯著的領(lǐng)導(dǎo)地位,近乎形成壟斷態(tài)勢(shì),而AMD則長(zhǎng)期穩(wěn)居市場(chǎng)份額的第二位。
今年初,英偉達(dá)又發(fā)布了其性能巔峰之作B200,其運(yùn)算能力相較于上一代H200芯片實(shí)現(xiàn)了近30倍的提升。
根據(jù)規(guī)劃,B200將于今年第四季度實(shí)現(xiàn)量產(chǎn)并投放市場(chǎng),預(yù)計(jì)將進(jìn)一步拉大與競(jìng)爭(zhēng)對(duì)手的差距。
然而,隨著MI325X的發(fā)布,AMD旨在與英偉達(dá)的Blackwell芯片展開有力競(jìng)爭(zhēng)。
AMD在其Instinct MI325X GPU中集成了8個(gè)MI325X單元,該配置能夠支持最高達(dá)2TB的HBM3E內(nèi)存;
其FP8精度下的理論峰值性能可達(dá)20.8 PFLOPs,而在FP16精度下則可達(dá)10.4 PFLOPs。
在系統(tǒng)架構(gòu)方面,AMD采用了Infinity Fabric互連技術(shù),實(shí)現(xiàn)了高達(dá)896 GB/s的帶寬,并且總內(nèi)存帶寬達(dá)到了48 TB/s。
此外,每個(gè)GPU的功耗也從原先的750W提升至了1000W。
與英偉達(dá)H200 HGX相比,Instinct MI325X在內(nèi)存量、內(nèi)存帶寬及算力水平方面分別展現(xiàn)出1.8倍和1.3倍的優(yōu)勢(shì)。
在推理性能上,其相較H200 HGX也實(shí)現(xiàn)了約1.4倍的提升。
在Meta Llama-2等主流模型中,MI325X的單GPU訓(xùn)練效率已超越H200,但在集群環(huán)境中,兩者則保持相當(dāng)水平。
此外,AMD還著重介紹了其下一代MI300系列GPU加速器——MI355X。
該型號(hào)基于下一代CDNA 4架構(gòu),并采用3nm制程工藝,其內(nèi)存容量已升級(jí)至288GB HBM3E。
MI355X能夠同時(shí)支持FP4和FP6數(shù)據(jù)類型,從而在保持計(jì)算精度的同時(shí),進(jìn)一步提升AI訓(xùn)練和推理性能。
AMD方面表示,下一代CDNA 4架構(gòu)相較于CDNA 3架構(gòu),預(yù)計(jì)將有35倍的性能提升和7倍的AI算力提升,同時(shí)內(nèi)存容量和帶寬也將提升約50%。
因此,明年的Instinct MI355X AI GPU在性能上預(yù)計(jì)將實(shí)現(xiàn)巨大飛躍。
根據(jù)AMD目前公布的數(shù)據(jù),Instinct MI355X AI GPU在FP16數(shù)據(jù)格式下的算力可達(dá)到2.3PF,相較于MI325X提高了1.8倍,并與英偉達(dá)B200的算力持平。
而在FP6和FP4格式下,其算力則能達(dá)到9.2PF,較B200在FP6格式下的算力提高近一倍,與B200在FP4格式下的算力相當(dāng)。
因此,MI355X被視為AMD真正對(duì)標(biāo)B200的GPU芯片。
Blackwell GPU的生產(chǎn)問(wèn)題目前已解決
此前有報(bào)道稱,Blackwell架構(gòu)產(chǎn)品的生產(chǎn)過(guò)程中遭遇了一些問(wèn)題,具體表現(xiàn)為良品率較低,進(jìn)而影響了出貨量。
英偉達(dá)Blackwell GPU作為首批采用臺(tái)積電CoWoS-L封裝技術(shù)的產(chǎn)品,該技術(shù)通過(guò)LSI橋接器構(gòu)建高密度互聯(lián),能夠無(wú)縫兼容各類高性能芯片。
然而,由于GPU芯片、RDL中間層、LSI橋接器及基板之間的熱膨脹系數(shù)(CTE)存在差異,這在一定程度上給生產(chǎn)帶來(lái)了挑戰(zhàn)。
摩根士丹利指出,英偉達(dá)Blackwell GPU在生產(chǎn)過(guò)程中出現(xiàn)的良率下降問(wèn)題主要發(fā)生在后封裝階段,這進(jìn)一步加劇了原本就緊張的CoWoS封裝及HBM3e內(nèi)存的供應(yīng)狀況。
不過(guò),該機(jī)構(gòu)認(rèn)為英偉達(dá)已內(nèi)部解決了這些問(wèn)題。
摩根士丹利預(yù)測(cè),英偉達(dá)將在今年第四季度出貨最多45萬(wàn)張Blackwell GPU,有望實(shí)現(xiàn)50億美元至100億美元的營(yíng)收。
同時(shí),該機(jī)構(gòu)還表示,由于當(dāng)前Blackwell GPU訂單已排滿至明年下半年,無(wú)法滿足的訂單將轉(zhuǎn)而推動(dòng)Hopper GPU的需求增長(zhǎng)。
英偉達(dá)Blackwell GPU的生產(chǎn)問(wèn)題曾被視為AMD公司的一個(gè)潛在機(jī)遇,然而,這一機(jī)遇并未如預(yù)期般兌現(xiàn)。
AMD的UDNA與英偉達(dá)CUDA競(jìng)爭(zhēng)生態(tài)位
在ADVANCING AI 2024大會(huì)上,AMD進(jìn)一步揭示了其AI芯片發(fā)展藍(lán)圖,宣布基于CDNA 4架構(gòu)的MI350系列將于明年面世,而MI400系列則將采用更為先進(jìn)的CDNA架構(gòu)。
然而,要撼動(dòng)英偉達(dá)CUDA生態(tài)的領(lǐng)先地位,AMD仍面臨諸多挑戰(zhàn),需付出長(zhǎng)期努力。
UDNA作為AMD的一項(xiàng)長(zhǎng)遠(yuǎn)布局,其潛力尚需時(shí)間驗(yàn)證。
AMD在擴(kuò)大市場(chǎng)份額的過(guò)程中,面臨的主要挑戰(zhàn)在于英偉達(dá)通過(guò)其CUDA平臺(tái)在AI軟件開發(fā)領(lǐng)域構(gòu)建了堅(jiān)固的壁壘,吸引了大量開發(fā)人員并深度綁定了他們與英偉達(dá)的生態(tài)系統(tǒng)。
CUDA生態(tài)系統(tǒng),作為英偉達(dá)所獨(dú)有的并行計(jì)算平臺(tái)與編程模型,現(xiàn)已確立為AI領(lǐng)域及高性能計(jì)算任務(wù)中的基準(zhǔn)標(biāo)準(zhǔn)。
AMD所面臨的挑戰(zhàn),不僅聚焦于硬件性能的提升,更在于構(gòu)建一個(gè)能夠吸引開發(fā)人員與數(shù)據(jù)科學(xué)家關(guān)注的軟件生態(tài)系統(tǒng)。
為此,AMD已加大對(duì)其ROCm(Radeon Open Compute)軟件堆棧的投資力度,并在近期活動(dòng)中宣布,已成功將AMD Instinct MI300X加速器在廣泛應(yīng)用的AI模型中的推理與訓(xùn)練性能提升一倍。
此外,該公司還指出,已有超過(guò)百萬(wàn)個(gè)模型能夠在AMD Instinct平臺(tái)上無(wú)縫運(yùn)行,這一數(shù)字是MI300X推出之初的三倍。
退出高端顯卡市場(chǎng),專注AI市場(chǎng)
對(duì)于游戲玩家群體,主流大廠針對(duì)英偉達(dá)產(chǎn)品的專屬優(yōu)化策略展現(xiàn)出了難以抗拒的吸引力。
鑒于此,AMD目前暫時(shí)退出高端顯卡市場(chǎng)的舉措,被視為一項(xiàng)更為明智的商業(yè)抉擇。
值得注意的是,這并非AMD首次在高端市場(chǎng)向英偉達(dá)讓步。
回溯至2017至2019年間,AMD實(shí)際上已缺席高端顯卡領(lǐng)域,彼時(shí)Vega 64與Radeon VII相繼淡出市場(chǎng),僅依賴RX580與RX590兩款產(chǎn)品在中低端市場(chǎng)維持競(jìng)爭(zhēng)力。
AMD當(dāng)前的戰(zhàn)略重心聚焦于中低端市場(chǎng),旨在擴(kuò)大用戶基礎(chǔ),并通過(guò)龐大的用戶群體引導(dǎo)開發(fā)者優(yōu)化產(chǎn)品。
此外,AMD的戰(zhàn)略性撤退或可視為其在AI領(lǐng)域[梭哈]的前奏。
鑒于AMD董事長(zhǎng)兼首席執(zhí)行官蘇姿豐博士對(duì)AI超級(jí)周期剛剛啟幕的堅(jiān)定判斷,公司將AI視為未來(lái)發(fā)展的關(guān)鍵方向,不惜重注投入。
面對(duì)AI芯片這一快速增長(zhǎng)的市場(chǎng),AMD無(wú)疑不愿錯(cuò)失良機(jī)。
盡管其CPU業(yè)務(wù)因ZEN架構(gòu)的成功而持續(xù)繁榮,但獨(dú)立顯卡、尤其是高端游戲顯卡的市場(chǎng)表現(xiàn)卻難盡如人意。
因此,揚(yáng)長(zhǎng)避短、專注于AI產(chǎn)品的開發(fā),成為了AMD當(dāng)前最合理的選擇。
盡管英偉達(dá)在AI訓(xùn)練性能領(lǐng)域依然保持顯著優(yōu)勢(shì),但AI領(lǐng)域的真正盈利點(diǎn)在于推理工作負(fù)載。
簡(jiǎn)而言之,訓(xùn)練是通過(guò)數(shù)據(jù)集來(lái)[教育]AI模型的過(guò)程,而推理則是訓(xùn)練后的模型對(duì)全新數(shù)據(jù)進(jìn)行預(yù)測(cè)的過(guò)程。
但值得注意的是,AMD對(duì)其加速服務(wù)器產(chǎn)品的定價(jià)策略相當(dāng)激進(jìn),這與凈利潤(rùn)率超過(guò)50%的英偉達(dá)形成了鮮明對(duì)比。
這一策略與AMD在CPU市場(chǎng)上削弱英特爾地位所采用的方法如出一轍,鑒于性價(jià)比優(yōu)勢(shì),該策略或?qū)⒋偈共糠挚蛻魪挠ミ_(dá)轉(zhuǎn)向AMD。
AMD當(dāng)下的首要目標(biāo)是爭(zhēng)取更多的市場(chǎng)訂單
TechInsights公司的研究報(bào)告指出,英偉達(dá)在2023年的數(shù)據(jù)中心GPU出貨量達(dá)到了約376萬(wàn)臺(tái),占據(jù)了97.7%的市場(chǎng)份額,這一比例與2022年大致相當(dāng)。
相比之下,AMD和英特爾分別以50萬(wàn)臺(tái)和40萬(wàn)臺(tái)的出貨量位列其后,市場(chǎng)份額分別占據(jù)了1.3%和1%。
對(duì)于AMD而言,其當(dāng)前的主要目標(biāo)并非超越英偉達(dá),而是積極爭(zhēng)取更多的市場(chǎng)訂單。
作為英偉達(dá)在市場(chǎng)上的少數(shù)競(jìng)爭(zhēng)對(duì)手之一,AMD始終被科技巨頭視為多元化的選擇之一。
目前,AMD業(yè)務(wù)中AI芯片所占比重持續(xù)攀升。
依據(jù)AMD二季度財(cái)務(wù)報(bào)告,AMD Instinct MI300X GPU在當(dāng)季度為AMD貢獻(xiàn)了超過(guò)10億美元的營(yíng)業(yè)收入,并預(yù)計(jì)全年銷售額將突破45億美元大關(guān),約占公司整體銷售額的15%。
值得注意的是,包括微軟、OpenAI、Meta、Cohere、Stability AI、Lepton AI及World Labs在內(nèi)的多家企業(yè),在其生成式AI解決方案中均選用了AMD Instinct MI300X GPU。
除了獲得科技巨頭的支持外,AMD產(chǎn)品的性價(jià)比優(yōu)勢(shì)也是其搶占市場(chǎng)的重要因素。
英偉達(dá)由于其技術(shù)領(lǐng)先和市場(chǎng)高占比,其產(chǎn)品溢價(jià)較高。
相比之下,AMD的MI300系列在性能上已經(jīng)超越了英偉達(dá)的H100,且價(jià)格更為親民。
這一性價(jià)比優(yōu)勢(shì)使得AMD在AI芯片市場(chǎng)上具有較大的發(fā)展?jié)摿Α?/p>
基于以上分析,蘇姿豐對(duì)AMD在2024年的人工智能芯片收入預(yù)測(cè)進(jìn)行了上調(diào),預(yù)計(jì)將達(dá)到超過(guò)45億美元的水平,這一數(shù)字高于其4月份的預(yù)估值40億美元。
這進(jìn)一步表明了AMD在AI芯片市場(chǎng)上的強(qiáng)勁增長(zhǎng)勢(shì)頭和廣闊發(fā)展前景。
與英偉達(dá)相似,AMD亦規(guī)劃每年推出全新的AI芯片產(chǎn)品。
結(jié)尾:
對(duì)于AMD而言,雖然英偉達(dá)產(chǎn)能的恢復(fù)可能帶來(lái)競(jìng)爭(zhēng)壓力,但幸運(yùn)的是,AMD也已逐漸找到了適合自己的競(jìng)爭(zhēng)節(jié)奏。
展望2025年,兩大芯片巨頭將在GPU領(lǐng)域再次正面交鋒,這將是檢驗(yàn)雙方綜合實(shí)力的關(guān)鍵一年。
隨著技術(shù)的不斷進(jìn)步和GPU在更多領(lǐng)域的廣泛應(yīng)用,這兩家公司將持續(xù)優(yōu)化GPU架構(gòu)、提高計(jì)算效率,共同推動(dòng)智能互聯(lián)時(shí)代的到來(lái)。
部分資料參考:潮外音:《AMD發(fā)布最強(qiáng)AI芯片,對(duì)標(biāo)英偉達(dá)Blackwell,2025年上市》,至頂頭條:《AMD發(fā)力GPU計(jì)算領(lǐng)域,現(xiàn)在壓力來(lái)到英偉達(dá)這邊》,機(jī)器之心:《AMD的GPU跑AI模型終于Yes了?PK英偉達(dá)H100不帶怕的》,電子發(fā)燒友網(wǎng):《AMD最強(qiáng)AI芯片,性能強(qiáng)過(guò)英偉達(dá)H200,但市場(chǎng)仍不買賬,生態(tài)是最大短板?》,美股研究社:《AMD 即將奪得英偉達(dá)的 AI 領(lǐng)先地位》,報(bào)告財(cái)經(jīng):《OORT創(chuàng)始人:AMD在AI芯片市場(chǎng)對(duì)英偉達(dá) 的挑戰(zhàn)》, NO 易摸:《AMD最強(qiáng)AI芯片登場(chǎng),性能或徹底超越英偉達(dá)》,三易生活:《放棄高端顯卡市場(chǎng),AMD或是選擇了[梭哈]AI》,賽博汽車:《挑戰(zhàn)英偉達(dá),AMD正成為一家AI芯片公司》,大盛唐電子:《英偉達(dá)與AMD:GPU競(jìng)爭(zhēng)的歷史與未來(lái)》
原文標(biāo)題 : AI芯天下丨分析丨未來(lái)的大模型,或許都是A卡來(lái)算的?
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 【一周車話】沒(méi)有方向盤和踏板的車,你敢坐嗎?
- 2 特斯拉發(fā)布無(wú)人駕駛車,還未迎來(lái)“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 大模型“新星”開啟變現(xiàn)競(jìng)速
- 6 海信給AI電視打樣,12大AI智能體全面升級(jí)大屏體驗(yàn)
- 7 AI 投流卷哭創(chuàng)業(yè)者
- 8 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 9 馬斯克致敬“國(guó)產(chǎn)蘿卜”?
- 10 神經(jīng)網(wǎng)絡(luò),誰(shuí)是盈利最強(qiáng)企業(yè)?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市