欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

案例解读 | 河南省某上市重工企业统一监控平台建设实践

2023-04-22 02:06:17 2596

摘要:项目背景客户介绍:案例客户前身为河南省某矿山机器厂,是国家“一五”期间兴建的156项重点工程之一,现为某大型央企集团旗下的境内A股上市公司。历经60多年的建设与发展,客户企业已成长为国家级创新型企业和高新技术企业,中国重型装备骨干企业,全球...

项目背景

客户介绍:

案例客户前身为河南省某矿山机器厂,是国家“一五”期间兴建的156项重点工程之一,现为某大型央企集团旗下的境内A股上市公司。

历经60多年的建设与发展,客户企业已成长为国家级创新型企业和高新技术企业,中国重型装备骨干企业,全球具有竞争力矿山重型装备和水泥成套装备供应商和服务商,全国领先的特种机器人研发及产业化基地,多次荣获中国工业大奖、中国质量奖提名奖、中国制造业单项冠军,被誉为“中国工业的脊梁,重大装备的摇篮”。

痛点分析:

作为老牌重点工程企业,客户企业信息化系统的应用较早,形成了比较完善的IT基础架构及业务系统,IT资源数量庞大,品类繁杂,IT环境异构问题较突出,对运维系统的依赖性强。

随着IT资源的逐渐老化,故障率逐渐提高,对业务支撑系统的风险加剧。企业运维部门在日常运维实践中发现,由于IT设备品类各异导致IT环境异构、运维工具散布等原因,故障率的升高使得运维人员的工作量越来越大,越来越吃力。

首先,由于运维管理工具缺乏体系,IT运维部门无法提前预知故障隐患,不能提前做出有效的维护规划;其次,当故障发生时,运维人员往往不能第一时间发现故障,更多是经由前端业务部门发现问题,再往后进行传递和反馈,运维人员才火急火燎地去解决;再次,由于运维管理手段落后,即便知道了故障的发生,也很难在第一时间找到故障的原因及位置,靠人工逐层分析,效率低下;最后,故障解决方案不能形成有效的复用机制,严重依赖运维人员个人工作经验及技术能力,不同的运维人员很难对类似故障进行快速解决。

乐维方案

基于客户企业原有的运维体系、运维痛点与具体需求,乐维为其量身打造了一套一站式智能运维监控解决方案,搭建统一监控平台整体框架,引入智能化告警管理系统、可视化管理系统、网络拓扑与报表管理体系,从多维度增强客户企业运维管理能力,为支撑业务系统提供更强有力的保障。

统一运维监控能力:

通过构建统一监控平台,对客户企业业务系统和IT 基础架构进行统一监控和集中管理,实现对IT资源,包括操作系统、网络设备、数据库、中间件、虚拟化、服务器、存储等数百个对象的统一监控;将监控和管理有机地结合起来,提高整个业务网络的运行质量,增强 IT 基础设施运行的稳定性和可靠性,同时提升运维部门的 IT 管理水平。

监控系统支持集中对象展示与自动分类展示,可整体直观看到当前整个IT系统运行状态是否正常,运维人员无需单独去登录每个系统、每个设备进行繁琐的巡检工作。

告警管理能力:

方案提供告警配置能力,可为运维人员提供信息资源的故障发现、故障定位、 故障报警乃至故障排除的全面故障处理机制,支持告警升级与多类型告警通知,变传统的被动应答故障处理方式为前瞻式监测的管理方式,及时发现、快速定位故障问题,第一时间解决问题。

系统提供的集中告警能力从实时告警、全部告警、告警统计等多个维度出发,做到告警无遗漏、告警分等级、告警可追溯,真正做到7* 24小时实时监控,从整体上减轻了运维人员的工作负担。

此外,运维人员还可查看最近6小时、最近12小时及最近24小时告警,了解整个资源运行状况,避免信息化资源出现告警隐患而人员未关注到时导致告警遗漏,对不同等级、告警事件、告警时长直观的呈现,更加准确的反馈系统整体健康状况,让运维人员心中有数。

可视化管理能力:

运维管理通常需要直观呈现重点关注的对象,可配置网络拓扑、业务拓扑,并通过投屏配置方式呈现,及时反映重点关注的如网络健康状况、专线链路状况等。当出现异常时,就可以快速定位故障,大大缩短故障定位、排查时间,并为解决故障提供有效依据。

方案支持将各监控模块的监控项数据作为数据源进行整合分析,实现将监控指标数据用生动、直观的形式在现场大屏上进行展示,同时可提供不同维度的多种展示模板,模板支持进行个性化设置:支持创建仪表盘、酷屏或魔方等形式的应用,支持双轴图、条图、地图、饼图、环形饼图、扇形图、嵌套图、单值图、水滴图、散点图、气泡图、雷达图、仪表盘等。

网络拓扑能力:

方案还提供了强大的网络拓扑能力。网络拓扑是整个信息化系统的“交通枢纽”,通过网络拓扑可直观地看到当前网络的健康状况。方案通过配置LLDP就可以实现网络拓扑自动发现、自动关联网络设备并生成拓扑图。

个性化报表系统:

根据客户企业要求,方案还提供个性化报表功能,支持创建核心交换机端口带宽及流量使用性能报表,并自定义设定成周报模式并每周自动生成报表;也可为单个业务系统创建报表,提供日报、周报,展现趋势数据,提供性能分析。

另外,对于整个信息化基础架构的运行状况,也可通过报表的告警统计,从不同维度进行查看,如操作系统告警统计、网络设备告警统计,以不同类别、不同等级分别展示。

客户收益

1. 通过IT资源的全面梳理、全栈监控、实时告警等新型智能运维手段,打造了一套完善且灵活的成熟运维体系,告别传统“救火”式运维,提升企业运维效率,降低运维成本。

2. 为业务系统提供更坚实的后勤保障,更加有效地保障运维人员日常工作,使得运维人员更加顺心的工作,进一步提升办公能力,为公司带来更好的服务。

3. 提供更有效的数据依据,推进客户企业信息化建设可持续发展,让信息化资源更合理的应用、最大化应用,并为其后期信息化建设提供导向。

更多行业运维案例,可以持续关注乐维社区。

版权声明:本站所有文章皆是来自互联网,如内容侵权可以联系我们( 微信:bisheco )删除!

相关推荐

友情链接
币圈社群欧易官网