RM新时代官网

您好,歡迎來(lái)到安徽省安全技術(shù)防范行業(yè)協(xié)會(huì)!
0551- 62818875 64280445
網(wǎng)站首頁(yè)>政策法規(guī)>行業(yè)資訊
行業(yè)動(dòng)態(tài)

行業(yè)資訊

監(jiān)控隨心做 初探曙光DCMM2監(jiān)控系統(tǒng)(圖)

來(lái)源:互聯(lián)網(wǎng) 發(fā)布時(shí)間:2008/10/08
 

    國(guó)內(nèi)信息產(chǎn)業(yè)的高速發(fā)展,極大加速了服務(wù)器的應(yīng)用規(guī)模,機(jī)群也已經(jīng)走下象牙塔,被越來(lái)越多的行業(yè)所接受。隨著機(jī)群系統(tǒng)的發(fā)展,機(jī)群的規(guī)模越來(lái)越大。當(dāng)機(jī)群的節(jié)點(diǎn)數(shù)達(dá)到幾百個(gè)以上時(shí),由于機(jī)群系統(tǒng)結(jié)構(gòu)松散、結(jié)點(diǎn)獨(dú)立性強(qiáng)、網(wǎng)絡(luò)連接復(fù)雜,造成機(jī)群系統(tǒng)管理不便,難以使用。我們有時(shí)候聽(tīng)說(shuō)企業(yè)的高性能計(jì)算機(jī)群中個(gè)別服務(wù)器死機(jī)后2-3個(gè)月才被發(fā)現(xiàn),可能我們很多人會(huì)把這當(dāng)作笑話,但這實(shí)際應(yīng)用中卻屢見(jiàn)不鮮。

圖

    如果沒(méi)有一套很好的系統(tǒng)對(duì)機(jī)群進(jìn)行監(jiān)控,有可能會(huì)極大降低高性能計(jì)算機(jī)群的使用效率,浪費(fèi)大量資源,這在環(huán)保被高度重視的今天是不可接受的。如何對(duì)集群系統(tǒng)的節(jié)點(diǎn)進(jìn)行實(shí)施有效的監(jiān)控,及時(shí)發(fā)現(xiàn)問(wèn)題,確保系統(tǒng)時(shí)刻處于高效狀態(tài)是每個(gè)服務(wù)器廠商在部署集群時(shí)首先要考慮的問(wèn)題。

    早在2006年,曙光開(kāi)始著手解決機(jī)群監(jiān)控管理的難題,并于當(dāng)年推出了曙光的機(jī)群監(jiān)控系統(tǒng)DCMM,幫助曙光用戶解決大規(guī)模機(jī)群管理的難題。DCMM的第2代產(chǎn)品已經(jīng)在曙光4000A中得到了有效驗(yàn)證。據(jù)曙光相關(guān)負(fù)責(zé)人介紹,隨曙光5000A的發(fā)布,曙光即將發(fā)布其DCMM的第3代產(chǎn)品。

    曙光DCMM通過(guò)軟/硬件結(jié)合的方式監(jiān)控整個(gè)集群服務(wù)器的軟硬件運(yùn)行環(huán)境與狀態(tài),如各節(jié)點(diǎn)網(wǎng)絡(luò)流量、CPU和內(nèi)存的使用率,各節(jié)點(diǎn)的主板溫度與CPU溫度,機(jī)箱風(fēng)扇轉(zhuǎn)速與CPU風(fēng)扇轉(zhuǎn)速,主板電壓與CPU電壓等等,使系統(tǒng)管理員對(duì)全體節(jié)點(diǎn)的情況一目了然。同時(shí)DCMM還可以針對(duì)部分交換機(jī)和曙光磁盤(pán)陣列等其他設(shè)備的實(shí)時(shí)信息監(jiān)控,進(jìn)行全面監(jiān)控,一網(wǎng)打盡。其安裝于機(jī)柜前方的顯示屏可以所有狀態(tài)直觀的顯示在機(jī)群的觸摸屏上,幫助用戶對(duì)機(jī)群進(jìn)行管理。

圖

    曙光DCMM同時(shí)提供報(bào)警功能,當(dāng)出現(xiàn)故障點(diǎn)時(shí)(如溫度異常、風(fēng)扇停止轉(zhuǎn)動(dòng)等),或超過(guò)預(yù)值時(shí),通過(guò)聲響和界面列表、彈出窗口、郵件報(bào)警等方式向系統(tǒng)管理員報(bào)警,及時(shí)提醒系統(tǒng)管理員進(jìn)行處理,避免或減少系統(tǒng)故障和由其引起的用戶損失。系統(tǒng)規(guī)模越大,系統(tǒng)管理和監(jiān)控的效率越高。

    曙光DCMM可以對(duì)任意節(jié)點(diǎn)進(jìn)行開(kāi)機(jī),重啟(冷啟動(dòng)),自動(dòng)順序開(kāi)機(jī)等日常工作,使系統(tǒng)管理員可以在控制室監(jiān)視整個(gè)機(jī)群系統(tǒng)的運(yùn)行情況并可以對(duì)最大1024節(jié)點(diǎn)中的任意一臺(tái)節(jié)點(diǎn)進(jìn)行類似本地的操作,而不需要進(jìn)入機(jī)房。曙光DCMM還支持遠(yuǎn)程訪問(wèn),管理員可以通過(guò)Modem遠(yuǎn)程撥號(hào)對(duì)機(jī)群系統(tǒng)進(jìn)行監(jiān)控和管理。

    曙光DCMM由于使用數(shù)據(jù)庫(kù)存儲(chǔ)監(jiān)控的信息,能夠提供歷史數(shù)據(jù)供技術(shù)人員分析和查詢,便于管理員調(diào)整設(shè)備檢修時(shí)間,錯(cuò)過(guò)系統(tǒng)使用的高峰期。

    曙光DCMM系統(tǒng)的節(jié)點(diǎn)端軟件有Window操作系統(tǒng)和Linux操作系統(tǒng)兩種不同版本,為客戶考慮周全。

    信息是一種重要的商業(yè)資產(chǎn)已經(jīng)成為廣大企業(yè)的共識(shí),如何保證信息的安全,確保系統(tǒng)的穩(wěn)定是每個(gè)企業(yè)在信息化進(jìn)程中首要考慮的問(wèn)題,曙光DCMM監(jiān)控系統(tǒng)的將為廣大企業(yè)打開(kāi)一扇希望之窗!

RM新时代官网