服务集锦 | 远程运维保障服务全解析
什么是神州信息远程保障服务?
神州信息远程保障服务,通过神州信息SOC服务运营中心,以平台化方式,为客户提供7*24的数据中心远程实时支持服务。包括7*24热线响应、大屏监控、用户需求受理、日常远程预防性检查、故障解决、配置/资产管理、应急预案准备和远程演练、知识库整理等服务内容。
提供每两周1次上门巡检,每季度1次深度巡检、故障远程/现场解决服务。按照ITIL流程进行事件/变更/问题/配置/可用性/持续性/服务级别管理。结合智能化/自动化运维工具,把数据中心监控、工单处理系统无缝结合。通过实时运维数据和趋势分析报表;并提供对IT运维过程的持续优化服务。
为什么要使用神州信息远程保障服务
IT运维人员在运维过程中面临的业务挑战和问题
- 业务运行环境复杂。IT运维人员面临多种品牌、多种功能的软硬件产品,从机房基础架构到上层应用都有。IT运维管理难度较大;
- 业务需求高。目前IT系统和业务紧密关联。IT系统停了,业务就停了。业务要求故障实时响应,实时解决;
- 业务对IT系统可用性要求越来越高。业务用户要求IT系统7*24的连续性和可用性。不能有宕机时间;
- IT人员运维工作繁重,重复操作多。运维工作量大,IT人员主要工作放在巡检、监控、例行操作等重复工作量,精力释放不出来;
- 运维人员不足或能力达不到要求。由于运行环境复杂,技术方向多,运维人员往往只能熟悉一到两个技术方向。很多时候忙于救火;
- 很多企业IT流程化规范化程度低。IT人员没有很好地遵守和执行ITIL流程,事件管理、变更管理、问题管理执行不到位。运维不规范造成运维事件增多,故障重复发生,用户满意度降低;
- 非工作时间故障解决时间长。目前IT运维人员往往是5*9驻场,非工作时间发生故障没法及时支持和解决,造成非工作时间业务恢复时间长;
- IT运维成本高,可是没有体现价值。由于业务对IT要求越来越高,IT系统越来越复杂,造成IT运维成本持续增高。可是对业务的价值却没有体现出来。
远程保障服务场景
- 对7*24数据中心监控运维服务有需求的客户。客户对IT系统稳定性、服务响应和支持的实时性要求高。系统环境复杂,要求能提供从底层基础架构到上层应用多技术方向的技术支持保障。在他们的用户感知之前发现和解决IT问题;
- 对目前服务质量不满意,要确保达成SLA和服务质量承诺的客户;
- 希望降低IT运维成本的客户;
- 希望利用IT运维工具,让IT运维的过程和结果可视可控的用户;
- IT运维流程执行不规范,不到位,希望借鉴行业先进的IT运维理念,完善ITIL运维流程的客户;
- 5*9驻场,非工作时间故障支持不到位,希望保障非工作时间故障支持的用户。
远程保障服务模式
- 服务范围:机房基础设施、物理资源、虚拟资源、平台资源、应用资源的监控和运维需求;
- 事前通过7*24运维数据分析,及时发现机房、网络、服务器、操作系统、存储、备份、数据库、中间件、应用业务趋势和故障隐患,提前发出预警,避免故障发生,提高系统稳定性。事中快速响应和解决故障;事后提交故障分析报告,分析故障的根本原因,避免故障重复发生;
- 提供历史数据趋势统计,每月提供运维优化分析报告,分析用户业务性能瓶颈和趋势,提出优化建议报告;
- 通过神州信息自动化监控工具,把所有监控告警收集到NOC监控及运维平台。神州信息服务运营中心通过7*24实时监控、遵循ITIL流程的事件/变更/问题处理、可视化运维、一线工程师和二线专家支持保证用户SLA达成;
- 通过平台化交付、人员复用,规范化操作、提前隐患分析、自动化工具降低整体运维成本;
- 通过标准化的IT运维流程,比如事件管理、问题管理、变更管理进行IT运维操作,通过一线工程师和后台技术专家,结合自动化工具进行处理和解决。最后会提交事件分析报告。分析趋势,找到根本原因,避免问题再次发生。