訂閱
糾錯(cuò)
加入自媒體

3D Xpoint將掀起人工智能領(lǐng)域一場(chǎng)革命?美光:我行

3D XPoint之美

3D XPoint連接了NAND存儲(chǔ)器(SSD存儲(chǔ)器)和DRAM存儲(chǔ)器(RAM)之間的鴻溝。正如SumitSadana所言:“3D XPoint是一種持久性存儲(chǔ)器,速度不如DRAM快,但明顯快于NAND,它與DRAM不同,沒(méi)有電也能保存狀態(tài)!

在原始讀寫(xiě)速度上,3D XPoint與常規(guī)NAND內(nèi)存更接近,幾乎相同。在廣受歡迎的YouTube硬件評(píng)論頻道Linus Tech Tips執(zhí)行的測(cè)試中,使用了3D XPoint技術(shù)的英特爾Optane硬盤(pán)的讀寫(xiě)速度大致為2GB/s,與三星最新的NAND SSD相同。 相比之下,RAMdisk(從DRAM模塊創(chuàng)建的虛擬磁盤(pán))的讀取或?qū)懭胨俣瓤梢猿^(guò)8GB/s。然而,3D XPoint的表現(xiàn)更像DRAM,尤其是在延遲上。

延遲是衡量給定存儲(chǔ)介質(zhì)響應(yīng)請(qǐng)求的速度的一個(gè)指標(biāo)。同樣是CPU請(qǐng)求一張貓的照片,NAND和3D XPoint都能夠以大約2GB/s的速度向CPU提供該圖片,但3D XPoint模塊的延遲(在CPU時(shí)間尺度上)更低,即它會(huì)比NAND模塊更早開(kāi)始傳輸信息。3D XPoint的響應(yīng)時(shí)間接近DRAM的響應(yīng)時(shí)間。

我們可以從另外一個(gè)角度思考這之間的差異。假如您想要從存儲(chǔ)器中讀取60 GB的連續(xù)數(shù)據(jù),那么,NAND和3D XPoint在原始速度方面的性能大致相當(dāng)。 但是,如果您想從存儲(chǔ)器中隨機(jī)執(zhí)行120,000個(gè)單獨(dú)的讀取請(qǐng)求,比如120,000張大小為500 KB的貓圖片,那么,3D XPoint模塊完成處理這120,000個(gè)請(qǐng)求的速度遠(yuǎn)快于NAND模塊。

3D XPoint的另一個(gè)顯著優(yōu)勢(shì)是其耐用性,F(xiàn)代NAND在失效之前可以寫(xiě)入數(shù)十萬(wàn)次至數(shù)百萬(wàn)次,但3D XPoint的耐久性與DRAM的耐久性相當(dāng),它的性能不會(huì)因?yàn)橹貜?fù)寫(xiě)入而降低。

3D XPoint實(shí)現(xiàn)

現(xiàn)在我們已經(jīng)知道了機(jī)器學(xué)習(xí)是如何工作的,也了解了3D XPoint的性能特征,F(xiàn)在,讓我們看看3D XPoint怎么被非常有效地使用,以加速甚至是革命性地改變機(jī)器學(xué)習(xí)。不過(guò),首先讓我們看看Sumit Sadana的一段講話,他暗示了美光在3D XPoint上可能正在做的工作:

“在云公司內(nèi)部,一個(gè)眾所周知的事情是,處理器需要花費(fèi)大量的時(shí)間等待數(shù)據(jù)。隨著這些新興處理器內(nèi)核數(shù)量在過(guò)去幾年內(nèi)的大幅增加,相對(duì)來(lái)講這些處理器的附屬內(nèi)存容量并沒(méi)有增加太多,這就意味著每個(gè)內(nèi)核可以使用的內(nèi)存帶寬容量是實(shí)際下降的。

這就是為什么使用3D XPoint擴(kuò)展這些進(jìn)程的可尋址內(nèi)存空間如此重要的原因,因?yàn)樗鼘?shí)際上可以給你帶來(lái)更大的回報(bào)和更高的性能,而不再是只能升級(jí)處理器到下一代版本上或者使用更快速的處理器。未來(lái)的處理器將允許更多的內(nèi)存連接到處理器上,這也將成為提高服務(wù)器平均能力的另一個(gè)驅(qū)動(dòng)因素!

上面這段話中的一個(gè)關(guān)鍵詞匯是“可尋址內(nèi)存”,它到底意味著什么?你看,CPU并不能直接尋址計(jì)算機(jī)中的所有內(nèi)存。你可以直接尋址DRAM,但是不能直接尋址硬盤(pán)或者SSD硬盤(pán)。

請(qǐng)注意,上圖中的CPU可以直接訪問(wèn)DRAM模塊中存儲(chǔ)的任何數(shù)據(jù),但無(wú)法對(duì)SSD硬盤(pán)執(zhí)行相同的操作。為了訪問(wèn)SSD上的數(shù)據(jù),CPU必須與存儲(chǔ)控制器通信,要求存儲(chǔ)控制器從硬盤(pán)驅(qū)動(dòng)器獲取一堆數(shù)據(jù)并將其放入RAM中。然后,CPU從RAM獲取所請(qǐng)求的數(shù)據(jù),這樣就實(shí)現(xiàn)了對(duì)SSD硬盤(pán)數(shù)據(jù)的訪問(wèn)。寫(xiě)入SSD的過(guò)程與讀取過(guò)程相反,CPU必須首先將一些數(shù)據(jù)寫(xiě)入RAM,然后要求存儲(chǔ)控制器從RAM中獲取該數(shù)據(jù)并將其寫(xiě)回到SSD中。正如你所看到的那樣,這里面涉及到很大的性能開(kāi)銷。

相比之下,您可以在圖的右側(cè)看到訪問(wèn)DRAM內(nèi)存和3D XPoint內(nèi)存的方式。在該模型中,CPU可以直接訪問(wèn)DRAM和3D XPoint存儲(chǔ)器中的內(nèi)存頁(yè)面。

Linus Tech Tips就這個(gè)概念做了一個(gè)視頻測(cè)試,他們使用了英特爾的Optane硬盤(pán)取代了測(cè)試機(jī)器上的存儲(chǔ)器。結(jié)果顯示,即使是在當(dāng)前的計(jì)算機(jī)架構(gòu)中,沒(méi)有使用特殊的操作系統(tǒng)級(jí)的配置,通過(guò)M2接口連接,使用3D XPoint內(nèi)存的Optane硬盤(pán)也足夠快,可以充分降低CPU訪問(wèn)數(shù)據(jù)的延遲。

為了讓該系統(tǒng)實(shí)現(xiàn)最高性能,美光必須和操作系統(tǒng)(Linux和Windows)開(kāi)發(fā)人員共同開(kāi)發(fā)一種基本全新的內(nèi)存結(jié)構(gòu)和訪問(wèn)機(jī)制。在一個(gè)計(jì)算機(jī)系統(tǒng)中,你可能有1級(jí)緩存、2級(jí)緩存,有時(shí)甚至需要3級(jí)緩存,然后是我們都知道的RAM或DRAM內(nèi)存。美光需要開(kāi)發(fā)可以實(shí)施另外一層基于3D XPoint技術(shù)的內(nèi)存介質(zhì)的驅(qū)動(dòng)程序,可能比DRAM稍慢一些,但是比DRAM更耐用,也更便宜。

相對(duì)于系統(tǒng)其余部分,這種設(shè)計(jì)調(diào)整可以相對(duì)透明地實(shí)現(xiàn)。系統(tǒng)會(huì)看到全部隨機(jī)存取存儲(chǔ)器,但是內(nèi)核會(huì)做出區(qū)分,將經(jīng)常運(yùn)行的應(yīng)用在DRAM中分配內(nèi)存頁(yè)面,同時(shí)為不太經(jīng)常使用但當(dāng)前仍然在運(yùn)行的應(yīng)用分配3D XPoint頁(yè)面。

這種方式對(duì)機(jī)器學(xué)習(xí)模型特別有用,它允許服務(wù)器將整個(gè)數(shù)據(jù)集加載到可尋址內(nèi)存中,然后CPU在可尋址的內(nèi)存空間上,在訓(xùn)練集上開(kāi)始前向傳播和后向傳播算法的訓(xùn)練。

更具體地說(shuō),如果您參考上文AI部分中的神經(jīng)網(wǎng)絡(luò)圖,理想的實(shí)現(xiàn)會(huì)將以X1,X2 ...等表示的數(shù)據(jù)集加載到3D XPoint存儲(chǔ)器中,同時(shí)將模型的主要部分,即我們?cè)趫D中隱藏的第2層和第3層加載到主DRAM中。模型的權(quán)重通常由theta,θ表示,它們將被存儲(chǔ)在DRAM中,并鏡像到3D XPoint進(jìn)行備份,以應(yīng)對(duì)硬件或軟件崩潰的情形。

CPU可以直接訪問(wèn)大量快速和低延遲的內(nèi)存,將使得CPU大部分時(shí)間處于滿載狀態(tài)。這意味著更好的投資回報(bào),更短的模型培訓(xùn)過(guò)程,以及機(jī)器學(xué)習(xí)任務(wù)的總體重大改進(jìn)。

結(jié)論

美光在最近這次年度會(huì)議上展示了公司良好的執(zhí)行力,他們火力全開(kāi),而且如果他們能夠以上文所討論的那樣進(jìn)行3D XPoint技術(shù)的部署,他們的股票可以獲得更高的市盈率。而且,它也會(huì)擺脫商品級(jí)芯片供應(yīng)商“周期上升,周期下降”的老討套路。如果他們能夠提供非易失性的可尋址內(nèi)存,并與Linux和Windows等操作系統(tǒng)完美集成,他們就能夠創(chuàng)建一種全新的存儲(chǔ)器類型,并滿足機(jī)器學(xué)習(xí)日益增長(zhǎng)的需求。

<上一頁(yè)  1  2  
聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)