首頁(yè) 資訊 > 創(chuàng)新 > 正文

世界時(shí)訊:浪潮分布式存儲(chǔ):讓數(shù)據(jù)融合互通,為"云數(shù)智"應(yīng)用構(gòu)筑新平臺(tái)


(相關(guān)資料圖)

數(shù)字時(shí)代,數(shù)據(jù)共享互通成為剛需

數(shù)字經(jīng)濟(jì)時(shí)代,云計(jì)算、大數(shù)據(jù)、人工智能等新技術(shù)快速發(fā)展,非結(jié)構(gòu)化數(shù)據(jù)爆發(fā)式增長(zhǎng),數(shù)據(jù)類(lèi)型變得愈發(fā)復(fù)雜多樣。在自動(dòng)駕駛、基因測(cè)序、氣象預(yù)報(bào)等云數(shù)智應(yīng)用場(chǎng)景中,一次數(shù)據(jù)處理可能會(huì)涉及到文件、對(duì)象、大數(shù)據(jù)等多種協(xié)議,數(shù)據(jù)間的互通轉(zhuǎn)換成為數(shù)據(jù)存儲(chǔ)中至關(guān)重要的一環(huán),具備平臺(tái)化能力的融合存儲(chǔ)成為數(shù)字基礎(chǔ)設(shè)施建設(shè)的核心。

以基因測(cè)序場(chǎng)景為例,一次完整的基因測(cè)序涉及到數(shù)據(jù)采集、格式化、脫敏、壓縮、分析、發(fā)布等操作,其過(guò)程可以大致分為樣本采集、DNA/RNA測(cè)序、數(shù)據(jù)分析和發(fā)布四個(gè)步驟。在不同的處理階段,需要使用不同的數(shù)據(jù)協(xié)議進(jìn)行操作。其中在樣本采集和DNA/RNA測(cè)序階段采用NFS文件協(xié)議,數(shù)據(jù)分析階段采用HDFS大數(shù)據(jù)協(xié)議,數(shù)據(jù)發(fā)布階段則是通過(guò)公網(wǎng)數(shù)據(jù)共享采用S3對(duì)象協(xié)議。整個(gè)數(shù)據(jù)處理過(guò)程涉及三種協(xié)議格式,這就意味著完成一次基因的測(cè)序流程需要在NFS、HDFS和S3之間進(jìn)行兩次數(shù)據(jù)拷貝和數(shù)據(jù)格式的轉(zhuǎn)換。傳統(tǒng)存儲(chǔ)僅支持單一的訪(fǎng)問(wèn)協(xié)議,這就會(huì)造成兩個(gè)問(wèn)題:一是數(shù)據(jù)格式轉(zhuǎn)換和數(shù)據(jù)拷貝會(huì)降低整個(gè)數(shù)據(jù)處理流程的效率;二是多套存儲(chǔ)副本增加存儲(chǔ)空間成本。

基因測(cè)序應(yīng)用需要使用多種數(shù)據(jù)協(xié)議

關(guān)鍵詞: 數(shù)據(jù)處理 數(shù)據(jù)分析 數(shù)據(jù)共享 使用多種 之間進(jìn)行

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2018 創(chuàng)投網(wǎng) - www.mallikadua.com All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號(hào)-3