基于多指標(biāo)的數(shù)據(jù)分級(jí)存儲(chǔ)策略
分級(jí)存儲(chǔ)采用的存儲(chǔ)方式與選擇的存儲(chǔ)設(shè)備的依據(jù)是數(shù)據(jù)的重要性、訪(fǎng)問(wèn)頻次等多個(gè)指標(biāo)。多指標(biāo)的數(shù)據(jù)信息分級(jí)策略,是指根據(jù)基于數(shù)據(jù)的生命周期、上次訪(fǎng)問(wèn)時(shí)間、大小、數(shù)據(jù)信息的關(guān)聯(lián)性等多個(gè)參數(shù)對(duì)數(shù)據(jù)的價(jià)值進(jìn)行分級(jí)。
如果數(shù)據(jù)一創(chuàng)建就能預(yù)測(cè)其訪(fǎng)問(wèn)特性進(jìn)而給出相應(yīng)級(jí)別,將能夠減少不必要的遷移顛簸。因?yàn)閿?shù)據(jù)分級(jí)變化意味著數(shù)據(jù)要在不同級(jí)別的存儲(chǔ)設(shè)備間遷移,以保證合適的數(shù)據(jù)在合適的時(shí)間存放在合適的存儲(chǔ)級(jí)別上。
在實(shí)際應(yīng)用中,如能充分挖掘數(shù)據(jù)的靜態(tài)特征和訪(fǎng)問(wèn)的動(dòng)態(tài)特征為基礎(chǔ)的分級(jí)將能獲得更好的效果。如以文件分級(jí)為例,第一,文件系統(tǒng)的靜態(tài)特征,如大小文件的分布;第二,文件系統(tǒng)的宏觀(guān)訪(fǎng)問(wèn)規(guī)律,如大小文件的訪(fǎng)問(wèn)次數(shù)分布;第三,文件個(gè)體的訪(fǎng)問(wèn)模式,如是否具有訪(fǎng)問(wèn)局部性;第四,文件之間的訪(fǎng)問(wèn)關(guān)聯(lián)特征,如同一作業(yè)中的一個(gè)文件被訪(fǎng)問(wèn),另一個(gè)文件何時(shí)被訪(fǎng)問(wèn)。
根據(jù)這些文件特征和存儲(chǔ)設(shè)備的分級(jí)情況,確定文件分級(jí)標(biāo)準(zhǔn)及文件分級(jí)變化的觸發(fā)條件,從而可以在合適的時(shí)間把合適的文件存放在合適的存儲(chǔ)級(jí)別上。
在線(xiàn)遷移中的一致性保證技術(shù)
在分級(jí)存儲(chǔ)系統(tǒng)中,不可避免地要在不同存儲(chǔ)設(shè)備上進(jìn)行數(shù)據(jù)遷移,數(shù)據(jù)遷移可分為升級(jí)遷移和降級(jí)遷移。升級(jí)遷移是指數(shù)據(jù)由慢速存儲(chǔ)設(shè)備和低一級(jí)存儲(chǔ)設(shè)備往快速存儲(chǔ)設(shè)備或高一級(jí)的存儲(chǔ)設(shè)備遷移,降級(jí)遷移正好相反。但由于遷移目的不同,這兩種遷移有不同的特征。
對(duì)于降級(jí)遷移來(lái)說(shuō),很可能在遷移的過(guò)程中并不會(huì)有I/O請(qǐng)求發(fā)生;但對(duì)于升級(jí)遷移來(lái)說(shuō),遷移幾乎是發(fā)生在I/O最密集的時(shí)候,如何保證在遷移過(guò)程中,盡可能減小遷移進(jìn)程對(duì)前臺(tái)I/O的影響,這是分級(jí)存儲(chǔ)系統(tǒng)需要解決的問(wèn)題之一。
目前可以采用讀寫(xiě)鎖來(lái)保證數(shù)據(jù)一致性,以數(shù)據(jù)塊為調(diào)度粒度來(lái)減小對(duì)前臺(tái)I/O性能的影響。遷移進(jìn)程為當(dāng)前數(shù)據(jù)塊申請(qǐng)讀寫(xiě)鎖,以保證遷移進(jìn)程與寫(xiě)操作進(jìn)程之間的數(shù)據(jù)一致性。
數(shù)據(jù)自動(dòng)遷移存儲(chǔ)技術(shù)
分級(jí)存儲(chǔ)中數(shù)據(jù)需要在線(xiàn)遷移,這就需要考慮數(shù)據(jù)移動(dòng)對(duì)前臺(tái)I/O負(fù)載的性能影響。數(shù)據(jù)自動(dòng)遷移技術(shù)是指最大限度的降低數(shù)據(jù)遷移動(dòng)作本身對(duì)計(jì)算結(jié)點(diǎn)的I/O性能影響,且對(duì)前端透明,它根據(jù)前臺(tái)I/O負(fù)載的變化,來(lái)調(diào)整數(shù)據(jù)遷移速率,使得數(shù)據(jù)遷移動(dòng)作本身對(duì)存儲(chǔ)系統(tǒng)的QoS的影響非常小,同時(shí)使得數(shù)據(jù)遷移任務(wù)能夠盡快完成。數(shù)據(jù)自動(dòng)遷移存儲(chǔ)涉及的主要技術(shù)有:數(shù)據(jù)遷移的速率控制與調(diào)度、數(shù)據(jù)遷移對(duì)應(yīng)用的延遲隱藏、文件訪(fǎng)問(wèn)塊位置序列預(yù)測(cè)等等。
在實(shí)際應(yīng)用中,當(dāng)數(shù)據(jù)信息達(dá)到遷移觸發(fā)條件時(shí),數(shù)據(jù)遷移結(jié)點(diǎn)自動(dòng)遷移數(shù)據(jù),從而實(shí)現(xiàn)數(shù)據(jù)信息的降級(jí)或升級(jí)存儲(chǔ),如數(shù)據(jù)升級(jí)遷移對(duì)用戶(hù)的延遲隱藏技術(shù)使得應(yīng)用程序感受不到數(shù)據(jù)升級(jí)遷移的延遲,并使整個(gè)存儲(chǔ)系統(tǒng)的性能與最高性能級(jí)別的存儲(chǔ)設(shè)備相當(dāng)。
目前,分級(jí)存儲(chǔ)管理更多從降低成本、不影響數(shù)據(jù)應(yīng)用效果、提高效率的角度解決數(shù)據(jù)的存儲(chǔ)問(wèn)題。隨著單盤(pán)成本的下降。
有業(yè)內(nèi)專(zhuān)家預(yù)測(cè),不久的將來(lái),近線(xiàn)存儲(chǔ)技術(shù)將取代數(shù)據(jù)遷移技術(shù),用戶(hù)將以模擬海量空間的、更為安全可靠的磁盤(pán)介質(zhì)保存歷史數(shù)據(jù)。而成熟完善的數(shù)據(jù)遷移技術(shù)將更好地融入到近線(xiàn)存儲(chǔ)設(shè)備中,為分級(jí)存儲(chǔ)的發(fā)展起到關(guān)鍵的推動(dòng)作用。