廣域網絡環(huán)境下分布式網絡計算系統(tǒng)監(jiān)控管理技術
采用一體化的監(jiān)控管理體系結構,支持管理功能的跨域、分布式部署、運行與協(xié)作。支持和擴展了標準的信息模型,提供了主機、集群、節(jié)點、網絡計算系統(tǒng)四個層次的監(jiān)控信息,為各監(jiān)控層次提供了完整的監(jiān)控度量指標。支持對硬件、軟件、網絡、服務等各類資源的監(jiān)控。支持OpenPBS、LSF、OAR等計算作業(yè)管理系統(tǒng)。 提供虛擬組織、系統(tǒng)操作員、站點管理員、普通用戶等不同層次的信息抽象視圖;提供強大的故障檢測和報警功能,以郵件等方式報告資源故障;提供完整的基于web2.0的數據展示界面;支持用戶定制的圖表的生成;采用分布式記賬方式,準確記錄用戶的資源消耗情況;支持靈活的計費策略。該技術目前在中國國家網格、藥物設計網格、高能物理網格以及中國國家網格工業(yè)社區(qū)等多個實際運行的分布式網絡計算系統(tǒng)當中得到應用。
北京航空航天大學
2021-04-13