廣域網絡環境下分布式網絡計算系統監控管理技術
采用一體化的監控管理體系結構,支持管理功能的跨域、分布式部署、運行與協作。支持和擴展了標準的信息模型,提供了主機、集群、節點、網絡計算系統四個層次的監控信息,為各監控層次提供了完整的監控度量指標。支持對硬件、軟件、網絡、服務等各類資源的監控。支持OpenPBS、LSF、OAR等計算作業管理系統。 提供虛擬組織、系統操作員、站點管理員、普通用戶等不同層次的信息抽象視圖;提供強大的故障檢測和報警功能,以郵件等方式報告資源故障;提供完整的基于web2.0的數據展示界面;支持用戶定制的圖表的生成;采用分布式記賬方式,準確記錄用戶的資源消耗情況;支持靈活的計費策略。該技術目前在中國國家網格、藥物設計網格、高能物理網格以及中國國家網格工業社區等多個實際運行的分布式網絡計算系統當中得到應用。
北京航空航天大學
2021-04-13