侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

浪潮分布式存儲(chǔ)助力江蘇省血液研究所搭建血液病檢測(cè)平臺(tái)

2022-05-20 16:04
來源: 粵訊

近年來,基因測(cè)序等分子生物學(xué)檢查技術(shù)已經(jīng)在血液病基因分析、基因診斷、白血病分型、指導(dǎo)治療、判斷預(yù)后等方面廣泛應(yīng)用,血液學(xué)成為現(xiàn)代生命科學(xué)技術(shù)發(fā)展最為活躍的領(lǐng)域之一。通過加強(qiáng)技術(shù)創(chuàng)新,中國(guó)血液學(xué)研究在基礎(chǔ)理論研究以及臨床轉(zhuǎn)化和實(shí)踐方面已然躋身世界前列。

基因測(cè)序作為一種新型基因檢測(cè)技術(shù),在生命科學(xué)研究中扮演著十分重要的角色。隨著測(cè)序技術(shù)的飛速發(fā)展,人類發(fā)現(xiàn)的基因序列數(shù)目以指數(shù)級(jí)增長(zhǎng),對(duì)于如此數(shù)量龐大的基因進(jìn)行同源性搜尋、比對(duì)、遺傳發(fā)育分析等操作,往往伴隨著巨大的數(shù)據(jù)處理量和并行計(jì)算量。江蘇省血液研究所(以下簡(jiǎn)稱血研所) 采用浪潮分布式存儲(chǔ)AS13000搭建了血液病檢測(cè)平臺(tái),支撐了前端的基因檢測(cè)業(yè)務(wù),并依靠方案的高可靠、高可用、易擴(kuò)容等特點(diǎn),保障血研所業(yè)務(wù)高效運(yùn)行并滿足后續(xù)業(yè)務(wù)持續(xù)增長(zhǎng)需求。

浪潮分布式存儲(chǔ)助力江蘇省血液研究所搭建血液病檢測(cè)平臺(tái)

浪潮分布式存儲(chǔ)助力江蘇省血液研究所搭建血液病檢測(cè)平臺(tái)

血研所主要研究方向?yàn)檠ㄅc止血、惡性血液病和造血干細(xì)胞移植,本次搭建的科研平臺(tái)主攻血液病的基因檢測(cè)場(chǎng)景;驕y(cè)序是一種新型基因檢測(cè)技術(shù),能夠從血液或唾液中分析測(cè)定基因全序列,預(yù)測(cè)罹患多種疾病的可能性,過程中將會(huì)產(chǎn)生大量的數(shù)據(jù),對(duì)存儲(chǔ)系統(tǒng)帶來了較大規(guī)模的挑戰(zhàn)。血研所也是國(guó)內(nèi)第一個(gè)血栓與止血研究室,需要對(duì)大量樣品進(jìn)行數(shù)據(jù)的采集、分析和計(jì)算,且對(duì)數(shù)據(jù)的持續(xù)讀取性能、安全性要求很高,隨著血液檢測(cè)的技術(shù)創(chuàng)新與精確度的提升,預(yù)計(jì)未來每年的數(shù)據(jù)增長(zhǎng)量在100TB左右。

浪潮分布式存儲(chǔ)支撐血液病檢測(cè)平臺(tái)

結(jié)合檢測(cè)平臺(tái)數(shù)據(jù)特點(diǎn)及需求,血研所采用浪潮分布式存儲(chǔ)AS13000系列,在基因測(cè)序過程中滿足了海量空間、高IO并發(fā)性能、業(yè)務(wù)連續(xù)性等需求,滿足了血研所臨床與多課題組同時(shí)在線使用的業(yè)務(wù)需求。

面對(duì)基因測(cè)序業(yè)務(wù)增長(zhǎng)帶來的性能和容量需求,浪潮分布式存儲(chǔ)AS13000通過文件方面的智能條帶化(Stripe)技術(shù),實(shí)現(xiàn)單個(gè)文件跨節(jié)點(diǎn)分布,提高數(shù)據(jù)并發(fā)訪問性能。若后續(xù)數(shù)據(jù)規(guī)模不斷增長(zhǎng),業(yè)務(wù)負(fù)載壓力變大,AS13000支持通過整合SSD資源作為高速數(shù)據(jù)緩沖區(qū),可進(jìn)一步提升系統(tǒng)IO性能。平臺(tái)一期建設(shè)配置超300TB可用空間,滿足血研所未來兩年的數(shù)據(jù)增長(zhǎng)需求,隨著血研所科研數(shù)據(jù)量的增加,還可通過節(jié)點(diǎn)在線橫向擴(kuò)展的模式,實(shí)現(xiàn)系統(tǒng)容量和性能呈線性增長(zhǎng),總?cè)萘靠蛇_(dá)EB級(jí),滿足基因測(cè)序數(shù)據(jù)持續(xù)增長(zhǎng)需求。

整個(gè)基因測(cè)序業(yè)務(wù)需要在高負(fù)載下7*24持續(xù)運(yùn)行,一旦出現(xiàn)業(yè)務(wù)中斷,那么整個(gè)基因測(cè)序工程就要中斷,甚至于整個(gè)的基因測(cè)序要重新進(jìn)行。因此,連續(xù)性是基因測(cè)序的根本生產(chǎn)力保證,基因測(cè)序業(yè)務(wù)對(duì)存儲(chǔ)系統(tǒng)連續(xù)運(yùn)行能力有極高的要求。浪潮分布式存儲(chǔ)在設(shè)計(jì)方面能夠保證所有的關(guān)鍵系統(tǒng)服務(wù)都分布在多個(gè)硬件上,避免系統(tǒng)資源單點(diǎn)故障,消除系統(tǒng)瓶頸;糾刪碼策略能夠在保障最高94%空間利用率的同時(shí),允許集群內(nèi)同時(shí)故障2個(gè)節(jié)點(diǎn)而數(shù)據(jù)不丟失,保障基因測(cè)序的業(yè)務(wù)連續(xù)運(yùn)行。

浪潮分布式存儲(chǔ)助力江蘇省血液研究所搭建血液病檢測(cè)平臺(tái)

江蘇省血液研究所血液病生物樣本庫經(jīng)過多年發(fā)展,建成包括生物樣本庫、臨床數(shù)據(jù)庫和質(zhì)量控制實(shí)驗(yàn)室三個(gè)部門的血液病生物資源庫,涵蓋樣本及信息收集、儲(chǔ)存、利用全環(huán)節(jié)的生物資源管理體系。截止目前,共收集了103910例各類血液疾病患者的樣本共計(jì)578331份,樣本類型涵蓋凍存細(xì)胞、骨髓組織、骨髓細(xì)胞玻片、血漿、血清、DNA和RNA等,出庫樣本量達(dá)59522份;臨床數(shù)據(jù)庫建立造血干細(xì)胞移植患者檔案3000余例。血液病生物資源庫是目前國(guó)內(nèi)規(guī)模較大的血液疾病生物資源庫之一,建立了國(guó)內(nèi)最大的造血干細(xì)胞移植、骨髓增生異常綜合征和急性混合細(xì)胞白血病的生物樣本研究隊(duì)列,為血液病基礎(chǔ)和臨床研究提供高質(zhì)量的樣本和數(shù)據(jù)支持。江蘇省血液研究所將繼續(xù)堅(jiān)持科研與臨床相結(jié)合的理念,努力建設(shè)成為具有國(guó)際一流水平的血液病臨床診療和轉(zhuǎn)化研究中心,為血液學(xué)領(lǐng)域做出新的貢獻(xiàn)。

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

醫(yī)療科技 獵頭職位 更多
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)