3D Xpoint將掀起人工智能領(lǐng)域一場(chǎng)革命?美光:我行
3D XPoint之美
3D XPoint連接了NAND存儲(chǔ)器(SSD存儲(chǔ)器)和DRAM存儲(chǔ)器(RAM)之間的鴻溝。正如SumitSadana所言:“3D XPoint是一種持久性存儲(chǔ)器,速度不如DRAM快,但明顯快于NAND,它與DRAM不同,沒(méi)有電也能保存狀態(tài)!
在原始讀寫(xiě)速度上,3D XPoint與常規(guī)NAND內(nèi)存更接近,幾乎相同。在廣受歡迎的YouTube硬件評(píng)論頻道Linus Tech Tips執(zhí)行的測(cè)試中,使用了3D XPoint技術(shù)的英特爾Optane硬盤(pán)的讀寫(xiě)速度大致為2GB/s,與三星最新的NAND SSD相同。 相比之下,RAMdisk(從DRAM模塊創(chuàng)建的虛擬磁盤(pán))的讀取或?qū)懭胨俣瓤梢猿^(guò)8GB/s。然而,3D XPoint的表現(xiàn)更像DRAM,尤其是在延遲上。
延遲是衡量給定存儲(chǔ)介質(zhì)響應(yīng)請(qǐng)求的速度的一個(gè)指標(biāo)。同樣是CPU請(qǐng)求一張貓的照片,NAND和3D XPoint都能夠以大約2GB/s的速度向CPU提供該圖片,但3D XPoint模塊的延遲(在CPU時(shí)間尺度上)更低,即它會(huì)比NAND模塊更早開(kāi)始傳輸信息。3D XPoint的響應(yīng)時(shí)間接近DRAM的響應(yīng)時(shí)間。
我們可以從另外一個(gè)角度思考這之間的差異。假如您想要從存儲(chǔ)器中讀取60 GB的連續(xù)數(shù)據(jù),那么,NAND和3D XPoint在原始速度方面的性能大致相當(dāng)。 但是,如果您想從存儲(chǔ)器中隨機(jī)執(zhí)行120,000個(gè)單獨(dú)的讀取請(qǐng)求,比如120,000張大小為500 KB的貓圖片,那么,3D XPoint模塊完成處理這120,000個(gè)請(qǐng)求的速度遠(yuǎn)快于NAND模塊。
3D XPoint的另一個(gè)顯著優(yōu)勢(shì)是其耐用性,F(xiàn)代NAND在失效之前可以寫(xiě)入數(shù)十萬(wàn)次至數(shù)百萬(wàn)次,但3D XPoint的耐久性與DRAM的耐久性相當(dāng),它的性能不會(huì)因?yàn)橹貜?fù)寫(xiě)入而降低。
3D XPoint實(shí)現(xiàn)
現(xiàn)在我們已經(jīng)知道了機(jī)器學(xué)習(xí)是如何工作的,也了解了3D XPoint的性能特征,F(xiàn)在,讓我們看看3D XPoint怎么被非常有效地使用,以加速甚至是革命性地改變機(jī)器學(xué)習(xí)。不過(guò),首先讓我們看看Sumit Sadana的一段講話,他暗示了美光在3D XPoint上可能正在做的工作:
“在云公司內(nèi)部,一個(gè)眾所周知的事情是,處理器需要花費(fèi)大量的時(shí)間等待數(shù)據(jù)。隨著這些新興處理器內(nèi)核數(shù)量在過(guò)去幾年內(nèi)的大幅增加,相對(duì)來(lái)講這些處理器的附屬內(nèi)存容量并沒(méi)有增加太多,這就意味著每個(gè)內(nèi)核可以使用的內(nèi)存帶寬容量是實(shí)際下降的。
這就是為什么使用3D XPoint擴(kuò)展這些進(jìn)程的可尋址內(nèi)存空間如此重要的原因,因?yàn)樗鼘?shí)際上可以給你帶來(lái)更大的回報(bào)和更高的性能,而不再是只能升級(jí)處理器到下一代版本上或者使用更快速的處理器。未來(lái)的處理器將允許更多的內(nèi)存連接到處理器上,這也將成為提高服務(wù)器平均能力的另一個(gè)驅(qū)動(dòng)因素!
上面這段話中的一個(gè)關(guān)鍵詞匯是“可尋址內(nèi)存”,它到底意味著什么?你看,CPU并不能直接尋址計(jì)算機(jī)中的所有內(nèi)存。你可以直接尋址DRAM,但是不能直接尋址硬盤(pán)或者SSD硬盤(pán)。
請(qǐng)注意,上圖中的CPU可以直接訪問(wèn)DRAM模塊中存儲(chǔ)的任何數(shù)據(jù),但無(wú)法對(duì)SSD硬盤(pán)執(zhí)行相同的操作。為了訪問(wèn)SSD上的數(shù)據(jù),CPU必須與存儲(chǔ)控制器通信,要求存儲(chǔ)控制器從硬盤(pán)驅(qū)動(dòng)器獲取一堆數(shù)據(jù)并將其放入RAM中。然后,CPU從RAM獲取所請(qǐng)求的數(shù)據(jù),這樣就實(shí)現(xiàn)了對(duì)SSD硬盤(pán)數(shù)據(jù)的訪問(wèn)。寫(xiě)入SSD的過(guò)程與讀取過(guò)程相反,CPU必須首先將一些數(shù)據(jù)寫(xiě)入RAM,然后要求存儲(chǔ)控制器從RAM中獲取該數(shù)據(jù)并將其寫(xiě)回到SSD中。正如你所看到的那樣,這里面涉及到很大的性能開(kāi)銷。
相比之下,您可以在圖的右側(cè)看到訪問(wèn)DRAM內(nèi)存和3D XPoint內(nèi)存的方式。在該模型中,CPU可以直接訪問(wèn)DRAM和3D XPoint存儲(chǔ)器中的內(nèi)存頁(yè)面。
Linus Tech Tips就這個(gè)概念做了一個(gè)視頻測(cè)試,他們使用了英特爾的Optane硬盤(pán)取代了測(cè)試機(jī)器上的存儲(chǔ)器。結(jié)果顯示,即使是在當(dāng)前的計(jì)算機(jī)架構(gòu)中,沒(méi)有使用特殊的操作系統(tǒng)級(jí)的配置,通過(guò)M2接口連接,使用3D XPoint內(nèi)存的Optane硬盤(pán)也足夠快,可以充分降低CPU訪問(wèn)數(shù)據(jù)的延遲。
為了讓該系統(tǒng)實(shí)現(xiàn)最高性能,美光必須和操作系統(tǒng)(Linux和Windows)開(kāi)發(fā)人員共同開(kāi)發(fā)一種基本全新的內(nèi)存結(jié)構(gòu)和訪問(wèn)機(jī)制。在一個(gè)計(jì)算機(jī)系統(tǒng)中,你可能有1級(jí)緩存、2級(jí)緩存,有時(shí)甚至需要3級(jí)緩存,然后是我們都知道的RAM或DRAM內(nèi)存。美光需要開(kāi)發(fā)可以實(shí)施另外一層基于3D XPoint技術(shù)的內(nèi)存介質(zhì)的驅(qū)動(dòng)程序,可能比DRAM稍慢一些,但是比DRAM更耐用,也更便宜。
相對(duì)于系統(tǒng)其余部分,這種設(shè)計(jì)調(diào)整可以相對(duì)透明地實(shí)現(xiàn)。系統(tǒng)會(huì)看到全部隨機(jī)存取存儲(chǔ)器,但是內(nèi)核會(huì)做出區(qū)分,將經(jīng)常運(yùn)行的應(yīng)用在DRAM中分配內(nèi)存頁(yè)面,同時(shí)為不太經(jīng)常使用但當(dāng)前仍然在運(yùn)行的應(yīng)用分配3D XPoint頁(yè)面。
這種方式對(duì)機(jī)器學(xué)習(xí)模型特別有用,它允許服務(wù)器將整個(gè)數(shù)據(jù)集加載到可尋址內(nèi)存中,然后CPU在可尋址的內(nèi)存空間上,在訓(xùn)練集上開(kāi)始前向傳播和后向傳播算法的訓(xùn)練。
更具體地說(shuō),如果您參考上文AI部分中的神經(jīng)網(wǎng)絡(luò)圖,理想的實(shí)現(xiàn)會(huì)將以X1,X2 ...等表示的數(shù)據(jù)集加載到3D XPoint存儲(chǔ)器中,同時(shí)將模型的主要部分,即我們?cè)趫D中隱藏的第2層和第3層加載到主DRAM中。模型的權(quán)重通常由theta,θ表示,它們將被存儲(chǔ)在DRAM中,并鏡像到3D XPoint進(jìn)行備份,以應(yīng)對(duì)硬件或軟件崩潰的情形。
CPU可以直接訪問(wèn)大量快速和低延遲的內(nèi)存,將使得CPU大部分時(shí)間處于滿載狀態(tài)。這意味著更好的投資回報(bào),更短的模型培訓(xùn)過(guò)程,以及機(jī)器學(xué)習(xí)任務(wù)的總體重大改進(jìn)。
結(jié)論
美光在最近這次年度會(huì)議上展示了公司良好的執(zhí)行力,他們火力全開(kāi),而且如果他們能夠以上文所討論的那樣進(jìn)行3D XPoint技術(shù)的部署,他們的股票可以獲得更高的市盈率。而且,它也會(huì)擺脫商品級(jí)芯片供應(yīng)商“周期上升,周期下降”的老討套路。如果他們能夠提供非易失性的可尋址內(nèi)存,并與Linux和Windows等操作系統(tǒng)完美集成,他們就能夠創(chuàng)建一種全新的存儲(chǔ)器類型,并滿足機(jī)器學(xué)習(xí)日益增長(zhǎng)的需求。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
-
精彩回顧立即查看>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
推薦專題
- 1 【一周車話】沒(méi)有方向盤(pán)和踏板的車,你敢坐嗎?
- 2 特斯拉發(fā)布無(wú)人駕駛車,還未迎來(lái)“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 6 馬斯克致敬“國(guó)產(chǎn)蘿卜”?
- 7 神經(jīng)網(wǎng)絡(luò),誰(shuí)是盈利最強(qiáng)企業(yè)?
- 8 比蘋(píng)果偉大100倍!真正改寫(xiě)人類歷史的智能產(chǎn)品降臨
- 9 諾獎(jiǎng)進(jìn)入“AI時(shí)代”,人類何去何從?
- 10 Open AI融資后成萬(wàn)億獨(dú)角獸,AI人才之爭(zhēng)開(kāi)啟
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市