郝文《大型软件系统运维之道》 郝文 汉得信息 2018-10-17 9月8日,由
羡慕羡慕羡慕羡慕
2019-05-22 15:40:24
  • 点赞
  • 7
  •   ♥  收藏
  • A
    分享到:
郝文《大型软件系统运维之道》
郝文 汉得信息 2018-10-17
9月8日,由上海市国资委指导,上海市国有资产信息中心主办,畅享网提供媒体支持的走进太平洋保险集团——信息化系统运维专场活动沙龙在太平洋保险大厦圆满举行。沙龙活动针对信息化系统运维工作中面临人员成本高、保障效率低、外包服务不满意等诸多问题,以优秀企业成功项目为例,分享经验做法,研讨解决方案。
以下为汉得信息AMS一部总经理郝文的讲话内容,他的演讲主题为《大型软件系统运维之道》,畅享网整理节选。
第一个案例:A集团(国内某知名电器集团)
A集团以Oracle ERP为核心统一运维,整个运维团队超过100人,这100人全部是汉得的顾问在支持,会有六七个人在负责事件管理,叫做事件经理,进行运维管理、运维体系建设以及运维质量的持续改善。
A集团现在是第四年运维,人员稳定性很高。因为大型企业的运维,哪怕不是汉得一家去做,是企业自己招的100人去做,都需要首先保障这些人的稳定,有了人员稳定和服务体系,接下来才能去改善它的体系,这是做传统运维一个根本目标。因为A集团三年前自己在做运维,不同的系统、不同供应商在零散做运维的时候,有它自己的运维体系和平台,包括事件管理、变更管理、运维的分析等一套自己成熟的东西。
A集团做统一运维,特别由一家运营商承接所有工作,有很大风险和挑战。它为什么做统一运维呢?无非是“多、乱、散、贵”。针对这四个方面的问题,A集团决定把所有系统全部打通,进行统一运维。就这样,汉得承接了统一运维的工作。
第一、将近两三百人的团队,一下缩减了一半还不止。
第二、原来做运维的人去了开发团队、去了业务团队,发挥更大的价值,人员的稳定性提升了。
第三、项目运维这块把它整个的资源、精力分担出去以后,A集团还构建了一个大型项目,这个项目的成功跟大运维密切相关。企业做一些数字化的转型,做一些IT到业务价值的提升,做大运维,需要把一些B端的标准化业务外包出去,这样会运营更轻松、资源更投入地去应对新的转型变革。
我们做的事情总结下来是六个,也是六个目标。
(一)服务质量。我们通过统一替代零散,服务质量得到提升。这不止是一个量级的提升。怎么提升服务质量呢?无非通过零散服务统一服务体系、统一考核,严格按照KPI去梳理,通过各种考核手段提升服务。
(二)管理\考核体系。由运维体系支撑,包括一些管理制度、流程、考核规范、针对员工的KPI考核,构建了这套运维考核体系。
(三)资源共享。我们提出了AB角的策略,有了AB角,A角流失了B角可以顶上。同时要求各行业线可以相互打通。
(四)知识沉淀。有了前面的基础很容易做到知识沉淀,特别是考核和KPI约束。
(五)B\R转换。
(六)人员稳定。
这六个目标具体怎么达成呢?
第一、人力的保障。汉得有庞大的资源给A集团保障,但是具体大运维、统一运维的时候,需要的不仅仅是人力支持。
第二、保障人员的稳定性。我们给A集团在当地成立的一家公司做了人员的培训、升级、激励,同时,还有一套科学严密的运维流程和体系规范,包括知识库、用户培训、AB角、奖励、满意度等等。
在人员提升方面,有了培训的素材因子之后,内部有一套针对项目的晋升体系。我们公司的咨询顾问体系跟行业相关,我们有30多套行业解决方案。在服务流程体系方面,有各种人员的进场、晋升的流程。整个ITO的运维管理不仅仅是解决问题,还包括管理、管理体系、日常运作、考勤流程,甚至是项目。
第三、KPI到个人。满意度管理,很多客户感兴趣怎么去做满意度落地。A集团是采取了惩罚的满意度管理方法,其实B公司采取的奖励方法,每个问题解决之后只要用户满意都会发表扬信,这两个企业的风格是不一样的。
第二个案例:B集团(世界500强企业)
B公司案例的特点是:
第一、全球运维,要一个团队支撑亚洲、欧洲、美洲不同时区业务,我们要保证多语言、不同时区之间的交界,能顺利承接。
第二、B公司模式跟A集团模式差别最大的是,A集团会有七到九个事件经理跟我们一起做运维体系,但是B公司只有一个人,他就是管我们的KPI。所有的体系、问题解决、服务质量全部自己搞定。
第三、把我们扔在自建的ODC里面做这个支持,他每个月只看KPI是否达标。大家可以想像KPI要有多细,基本上是小数点后两位,如果差一点质量会大幅下降,我们的收款会遇到严格的考验。
所以A集团跟汉得共建中心,共同做持续的改善。B公司把这一块变成服务交付给它,它只管结果,这是两个根本的不同。同时在结算模式上不一样,因为A集团是共建的,所以按人力的模式,我买你100人去做。B公司是不管你有多少个人,帮我搞定多少个事件,我只看多少个事件单,我一个单给你多少钱。包括场地、交接、管理全部含在这个事件单了,一口价,这是一个模式的创新。
在B公司我们做了几方面的工作:第一,按照B公司的信息安全要求,在汉得园区里面构建了B公司远程交互中心。因为我们做运维业务,是直接接触生产环境账号的,所以安全是第一位的。第二,因为是7乘24小时,所以是很多团队在支持。我们还增加了白班解决率和夜班解决率,还有在线支持接通率,未来总体就是降成本、降人力。
总的来说B公司的模式就是轻资产。在运维这块轻资产也是有好处的,除了人力、场地,还包括知识都是轻资产、标准化的。这个对大型企业而言不一定是个必然选择,但是是可选的一条路。
第三个案例:C公司(国内知名食品企业)
C公司的特点是叫做可量化的服务标准与基线。A集团按照人力输出共同构建的形式,按照SLA来,SLA有不同的层次,比如技术层面,如果是合格的,基本的钱能给你。这会有个问题,供应商达到这个水准和基线就原地不动了,我就收到钱了。这不是一个共同提升目标方向的事情,如果在基线之上不同的层次,再往上进一阶再给你更多的奖励,就像游戏打关一样,我会给你相应的奖励和合同金额。这是一个组合模式,是可以促进外包供应商不断提升的模式。
同时,肯定需要运维体系的方法和工具落地,以及层层去挖掘基于系统运营层面的东西。我们是基于这样的平衡计分卡的概念去运维层面进行层层剖析,来保证一个组合一个阶梯的往上提升,最后运营商有收益、客户也有收益,服务质量在不断提升,这是C公司的特点。
C公司用我们自己研发的工具,把它整个研发体系落地到我们的运维体系,包括一些运营分析,全部通过我们这个平台落地。我基于SLA生命周期的设计,这个比较复杂,具体看一个事件单过来了怎么样处理、走什么样的路径,以及到下一个阶段有怎么样的KPI输出等等。
基于云的机构的案例
第一个是D公司(某知名服装企业),它敏捷性的应用要求很高,和传统运维做的事情不一样,我们发现核心模块很简单,就是门户再加订单的枢纽,我们处理各种各样的接口,跟外围、电商的,基础架构这块发现有微软云,也有本地的IDC,我们怎么样做好混合云的运维支持。既要有懂云的人,还要有懂IDC的人,还要懂它们之间的接口怎么去处理。
基于云的运维,像双十一,要有现场的支持体系,遇到问题随时响应。同时加了一些DevOps架构,区别就是高并发。一个是面向数据导向,一个是面向用户导向,我们要变被动为主动,用工具化、自动化的形式去实现。
第二个是基于云的车联网案例,我们面向整个车厂去推解决方案,这个模式我们也是在探索,我们更多在运维模型做延伸。刚开始方案不一定成功,可能推了100辆车有这个电子设备。刚开始很难测算整体未来的费用,如果推成功未来有几十万辆车用这套设备。这个时候运维费用不是线性增加,是一个曲线性增加。我们期望在这种新型的工作模式下——跟客户一起绑定去输出解决方案的时候,随着业务量的扩大,我们提供的运维模型总的费用是一个逐步提升的过程,但是单个车辆、单位的费用是持续下降的,这样才能构成供应的层面。对企业而言、对解决方案商而言,设备需求多,它也更愿意做好增量的支持。销量好,有多余的费用,相应的费用也是可以得到提升的。
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500