訂閱
糾錯(cuò)
加入自媒體

速度提升數(shù)十倍,用光子計(jì)算重塑AI算力集群

前言:

要實(shí)現(xiàn)超強(qiáng)的AI能力,需要超大規(guī)模的模型,要訓(xùn)練超大規(guī)模的AI模型,需要數(shù)千,甚至上萬(wàn)的GPU協(xié)同工作。

這就帶來(lái)幾個(gè)問(wèn)題:更多的GPU造成的高能耗,計(jì)算卡與計(jì)算卡之間的通信延遲,計(jì)算集群與計(jì)算集群之間的通信延遲和算力損耗。

那么,如果用光來(lái)計(jì)算,用光來(lái)傳輸,會(huì)怎么樣?

作者 | 方文三

圖片來(lái)源 |  網(wǎng) 絡(luò) 

光子計(jì)算初創(chuàng)公司Lightmatter

Lightmatter近日宣布成功融資4億美元,這一巨額資金將用于突破現(xiàn)代數(shù)據(jù)中心的瓶頸。

Lightmatter作為一家在光學(xué)領(lǐng)域具有創(chuàng)新實(shí)力的公司,其研發(fā)的光學(xué)技術(shù)成功應(yīng)用于AI算力集群,實(shí)現(xiàn)了性能的飛躍。

傳統(tǒng)的電子傳輸在數(shù)據(jù)處理速度上逐漸面臨瓶頸,而Lightmatter的光學(xué)技術(shù)則利用光子的特性,以光速進(jìn)行數(shù)據(jù)傳輸和處理,大大減少了數(shù)據(jù)傳輸?shù)难舆t,從而顯著提高了整個(gè)算力集群的運(yùn)行效率。

這種技術(shù)突破并非一蹴而就,是Lightmatter團(tuán)隊(duì)長(zhǎng)期投入研發(fā)的成果。他們?cè)诠鈱W(xué)芯片設(shè)計(jì)、光通信協(xié)議等關(guān)鍵領(lǐng)域進(jìn)行了深入研究和創(chuàng)新,克服了諸多技術(shù)難題,最終實(shí)現(xiàn)了將光學(xué)技術(shù)與AI算力集群的完美融合。

Lightmatter由Nicholas Harris、Darius Bunandar和Thomas Graham于2017年創(chuàng)立。Nicholas Harris是麻省理工學(xué)院量子光子實(shí)驗(yàn)室的成員,2012年,他與合作者實(shí)現(xiàn)了“可編程納米光子處理器”(PNP),這是一種基于硅光子學(xué)的光學(xué)處理器,可以對(duì)光進(jìn)行矩陣變換。

光子計(jì)算重塑AI算力集群

Lightmatter有光子計(jì)算單元,有光學(xué)芯片封裝和傳輸技術(shù),能夠系統(tǒng)化提升整個(gè)AI計(jì)算集群的計(jì)算力,計(jì)算效率,并降低功耗。

Lightmatter的光學(xué)互連層技術(shù)允許數(shù)百個(gè)GPU同步工作,極大地簡(jiǎn)化了AI模型訓(xùn)練和運(yùn)行的復(fù)雜性和成本。

AI技術(shù)的迅猛發(fā)展,數(shù)據(jù)中心行業(yè)迎來(lái)了前所未有的增長(zhǎng),但并非簡(jiǎn)單的增加GPU數(shù)量就能解決問(wèn)題。

高性能計(jì)算專(zhuān)家早已指出,如果超級(jí)計(jì)算機(jī)的節(jié)點(diǎn)在等待數(shù)據(jù)輸入時(shí)處于空閑狀態(tài),那么節(jié)點(diǎn)的速度再快也無(wú)濟(jì)于事。

互連層是將CPU和GPU架構(gòu)成一個(gè)巨大計(jì)算機(jī)的關(guān)鍵,而Lightmatter通過(guò)其自2018年以來(lái)開(kāi)發(fā)的光子芯片,構(gòu)建了目前最快的互連層。

公司CEO兼創(chuàng)始人Nick Harris表示,超大規(guī)模計(jì)算需要更高效的光子互連技術(shù),而傳統(tǒng)的Cisco交換機(jī)無(wú)法滿(mǎn)足這一需求。

目前,數(shù)據(jù)中心行業(yè)的頂尖技術(shù)是NVLink和NVL72平臺(tái),但這些技術(shù)在網(wǎng)絡(luò)速度和延遲方面仍存在瓶頸。

Lightmatter的光子互連技術(shù)通過(guò)純光學(xué)接口,每根光纖可達(dá)到1.6 terabits,顯著提升了數(shù)據(jù)中心的性能。

創(chuàng)始人Harris指出,光子技術(shù)的發(fā)展速度遠(yuǎn)超預(yù)期,經(jīng)過(guò)七年的艱苦研發(fā),Lightmatter已經(jīng)準(zhǔn)備好迎接市場(chǎng)的挑戰(zhàn)。

超快計(jì)算,超快連接,軟件兼容

Lightmatter的產(chǎn)品分為光子計(jì)算平臺(tái)(Envise),芯片互連產(chǎn)品( Passage)和適配軟件(Idiom)三部分。

Envise:是世界首個(gè)光子計(jì)算平臺(tái),每個(gè)Envise處理器擁有256個(gè)RISC內(nèi)核,提供400Gbps的芯片間互連帶寬,而且支持PCI-E 4.0標(biāo)準(zhǔn)接口,具有不錯(cuò)的兼容性。

Envise處理器的原理是光通過(guò)波導(dǎo)進(jìn)行計(jì)算,而每增加一種顏色的光源,就能相應(yīng)增加運(yùn)算速度。

同樣是一個(gè)計(jì)算核心,當(dāng)光源種類(lèi)達(dá)到8種,就能提升8倍的計(jì)算性能,同時(shí)計(jì)算效率也達(dá)到普通計(jì)算核心的2.6倍。當(dāng)計(jì)算核心和光源種類(lèi)同步提升時(shí),計(jì)算性能可以提升數(shù)十倍。

Passage:是一種利用光子進(jìn)行芯片互連的技術(shù),屬于I/O技術(shù)的一種。任何超級(jí)計(jì)算機(jī)都由許多小型獨(dú)立計(jì)算機(jī)組成,為了發(fā)揮性能,它們必須不斷相互通信,確保每個(gè)核心都知道其他核心的進(jìn)展,并協(xié)調(diào)超級(jí)計(jì)算機(jī)設(shè)計(jì)應(yīng)對(duì)的極其復(fù)雜的計(jì)算問(wèn)題。

Lightmatter的技術(shù)利用波導(dǎo)(wave guide)而非光纖在一個(gè)大的芯片間為各個(gè)不同種類(lèi)的計(jì)算核心互連并傳輸數(shù)據(jù),這提供了極高的并行互連帶寬。

Idiom:是一個(gè)工作流工具,它可以讓基于Pytorch、TensorFlow或ONNX等框架構(gòu)建的模型,直接在Envise計(jì)算基礎(chǔ)設(shè)施上使用。無(wú)需更改 Pytorch、TensorFlow或ONNX文件。

此外,它還為開(kāi)發(fā)者提供一系列方便的工具,例如可以自動(dòng)虛擬化每個(gè) Envise服務(wù)器,在多個(gè)Envise服務(wù)器之間執(zhí)行分區(qū),為多個(gè)不同的用戶(hù)個(gè)性化分配使用的芯片數(shù)量。

市場(chǎng)競(jìng)爭(zhēng)格局

Lightmatter的光子互連技術(shù)不僅提升了數(shù)據(jù)中心的性能,還吸引了包括微軟、亞馬遜、xAI和OpenAI在內(nèi)的眾多大型數(shù)據(jù)中心公司的關(guān)注。

此次4億美元的D輪融資使Lightmatter的估值達(dá)到44億美元,成為光子計(jì)算領(lǐng)域的領(lǐng)軍企業(yè)。

但專(zhuān)注于光子計(jì)算的公司,不止Lightmatter一家,Celestial AI也在今年3月獲得了1.75億美元的C輪融資,它主要利用光在芯片內(nèi)部和芯片之間進(jìn)行數(shù)據(jù)移動(dòng),與Lightmatter的Passage類(lèi)似。

中國(guó)市場(chǎng)上也有不少在光子計(jì)算領(lǐng)域耕耘的公司,只是它們的發(fā)展規(guī)模相對(duì)較小。

目前,中國(guó)市場(chǎng)的AI算力硬件公司們,其實(shí)面臨著彎道超車(chē)的機(jī)會(huì)。這個(gè)局面有些像中國(guó)的新能源汽車(chē)行業(yè),不在舊有的體系架構(gòu)上追趕國(guó)外巨頭,而用新技術(shù)去滿(mǎn)足新需求,建立自己的優(yōu)勢(shì)。

一方面AI計(jì)算是一個(gè)相對(duì)較新的領(lǐng)域,海外的公司有領(lǐng)先,但是并沒(méi)有構(gòu)建很難逾越的壁壘,另一方面AI是專(zhuān)有計(jì)算,有不少開(kāi)源的計(jì)算架構(gòu)適合AI。

中國(guó)公司只要能研發(fā)出一些自有的IP,再利用本身就具有的強(qiáng)工程能力,就很有可能開(kāi)發(fā)出至少不遜于海外的算力硬件。

結(jié)尾:

未來(lái),Lightmatter不僅將繼續(xù)優(yōu)化互連技術(shù),還將開(kāi)發(fā)新的芯片基板,進(jìn)一步提升光子計(jì)算的性能。Harris預(yù)測(cè),未來(lái)十年,互連技術(shù)將成為摩爾定律的核心。

內(nèi)容來(lái)源于:阿爾法公社:用光學(xué)讓AI算力集群提速數(shù)十倍,Lightmatter融資4億美元|AlphaFounders;安特恩:光子計(jì)算新紀(jì)元:Lightmatter融資4億美元,引領(lǐng)AI數(shù)據(jù)中心革命

       原文標(biāo)題 : AI芯天下丨趨勢(shì)丨速度提升數(shù)十倍,用光子計(jì)算重塑AI算力集群

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)