互联网对于任何行业来说,都是机遇与挑战并存,对泰康保险而言,更是这样。
一方面泰康深知传统企业互联网化是大势所趋,这几年一直在积极探索实践,2014 年起连续推出乐业保、春运险、微互助等创新产品,成为传统保险行业互联网创新的典范。
另一方面泰康现有的 AS/400+CSC 交易处理机制不是面向 7X24 小时的,无法适应互联网海量在线实时交易场景,就算可以将其改造,但高昂的费用和至少半年以上的准备时间会使泰康在这场互联网保险的盛宴中失去先机。
是继续沿用成熟的技术老路,还是破釜沉舟,选用新的技术、新的平台,以一场技术变革来支撑成就泰康保险业务在互联网时代的高速发展?
本文中泰康保险数据中心基础设施经理萧军,将会从技术角度来分享泰康保险集团的云端实践。
曾经泰康认为云计算就等于虚拟化,所以非常把所有设备向虚拟化平台迁移,也取得了很好的效果,包括设备提供时间、系统扩展等能力都有很大的提升。但当泰康迈向移动互联网的时候,发现传统架构的虚拟化并不能完全满足需求,泰康在广泛的调研和严格的技术认证后,确定了采用云计算平台这一思路。
那么为什么要建设私有云呢?主要有以下五点原因:
第一,国家安全的要求。泰康保险作为金融机构,首先必须合规,另外国家保监会对于泰康也会有一些技术是否自主可控等方面的要求,这些都决定了我们不能像其它非金融企业一样采用将所有的业务搬到公有云。
第二,时效性的挑战。泰康作为全国首家实现全程网上投保的保险公司,用“互联网+”的发展战略不断地敦促自身前进。这个过程中,一周将近推出 30 多种产品,整个产品的研发、上线周期非常短,因此对于 IT 资源的响应速度提出了很高的要求。
第三,业务量的挑战。每周 30 余个产品,带来的用户量非常大,这个对于 IT 基础架构的扩容、并发、可靠性等方面提出了要 求。而且,互联网业务最大的特点就是不确定性,原有的基础设施不具备弹性,没有办法随着业务的变化,对 IT 资源进行伸缩。
第四,生态的挑战。比如即时通信,泰康的业务系统现在经常与微信、微信支付、途牛网站、美团网等其它的第三方接口进行对接。这对于传统的 IT 基础架构来说,没有办法实现。所以我们只能往前走,选择云平台的方式来满足业务部门的需求。
第五,成本的挑战。大量的新产品、订单、合作等等,给 IT 系统的扩容与运维人员带来了很大的挑战。传统 IT 架构下,首先没有办法直接扩容,只能不断的购买新的设备,比如存储柜;其次,每个产品都需要一个专业的运维人员去管理设备,调度资源。这两方面的开销太大了。通过云平台,我们可以降低 IT 资源成本,同时提高人员工作效率。
泰康对于整个云平台的设想是这样的,基于公有云和私有云的 IT 基础平台上构建三朵云:
保险云。目前保险云上不仅仅有泰康的传统业务,泰康在线以及新的项目产品都在上面。
资管云。现在泰康资产管理公司已经做到全国第一了,所以自身有一个非常大的资管云。
医养云。现在泰康发力养老社区的建设,在全国已经有 4 家养老社区(北京、上海、广州、成都),养老社区本地的资源有限,不可能为每个养老社区建一套 IT 信息系统,所以必须采用云化的方式来支撑养老社区的 IT 建设。
目前这三朵云基本都落地了,在这三朵云之上,泰康业务的发展还需要依托于大数据和移动互联网。做云平台这一年半以来,我觉得云平台、大数据平台、移动互联网充分满足了泰康传统业务在拥抱互联网时的诉求:
面向互联网业务平台的建立,平台的基础设施应该具备响应快速、动态灵活的能力与特点,支撑公司战略目标的落地。
面向传统业务、大数据提供适用于不同应用场景、统一交付与管理的基础设施即服务。
基于互联网的创新业务,周五晚至周末两日是周业务处理的高峰时段;
创新产品如采用“大促”或类”秒杀”等电商营销手法,将会产生无法精确估算的短时高容量访问和交易;
移动端设备的访问将成为主要的创新业务入口,移动 App 的体验是重要的 KPI 之一;
创新业务上线前的容量规划,无法如传统业务那样做出准确估算,通常基于互联网的电商类业务,容量问题需要通过弹性方式来动态解决。
泰康建立面向行业的大健康云、保险云、资管云、养老云,需要自主服务、自动化的运维体系进行支撑。
IT 系统的发展历程
回顾整个泰康的基础架构,基本经历了三个阶段。
一是传统架构。小型机、X86 服务器或是集中式传播访问数据库,不管是 CS 架构的还是 DS 架构的,都是那种集中式访问传统架构。所有的硬件及功能都是割裂的,需要面对多个管理界面并分别维护 IP 和 SAN 网络。为了满足性能需求只能不断的通过纵向扩展的方式升级硬件设备,但存储与计算的分离设计限制了扩展性及灵活性。
二是虚拟化架构。我们在使用青云平台之前,就是采用 VMware 虚拟化架构,因为外部存储原因注定了这个平台不能快速进行业务、产品的发布,不能扩容。
三是基于云计算的融合架构。经过不断的努力,最终成功将 IT 系统架构从传统的三层架构演化为以超融合一体化设备为载体,以软件定义的云平台为基础,提供包括存储虚拟化、计算虚拟化、网络虚拟化以及提供统一管理调度平台的 IT 架构。
青云 QingCloud 作为泰康云平台主要技术解决方案提供商,是泰康云的重要组成部分,泰康云成熟的云平台技术构建了响应快速、动态灵活、可持续的云计算平台,有效地解决传统数据中心面临的资源管理复杂、运维操作风险高、服务响应慢的难题。泰康保险在实施云平台后的收益主要有以下几点:
资源池化带来的好处是解决了成本的问题,解决了快速提交的问题,还解决了统一性,一致性的问题。
通过泰康云平台,我们的基础设施可以实现高可用,同时解决了水平扩展的问题,另外,对于海量数据与信息,通过负载均衡技术也得到了解决。
自动调度技术是弹性扩展、弹性伸缩、负载均衡以及资源自动交付的必备技术。举个例子:现在我们的资源池上虚拟机器已经有 3000 多台了,随着 Docker 的引入,我们现在也运行了 2000 多个 Docker。如果没有一个好的自动调度技术,没有一个好的资源自主交付服务,最后我们的系统对于任何人来说,都会成为一个噩梦。
智能运维技术
API
泰康的云平台具有极高的开放性,我们提供一定的 API 接口。这个 API 是由一个团队专门开发的,它是通过对 CMDB,还有自定义函数的定义,使泰康的云平台具有 API 服务,对外提供一些微服务,这样,开发团队在使用过程中会更方便,同时,也解决了第三方集成、个性化定制的问题。
泰康保险的自动化运维规范和体系建设图
上图是泰康保险的自动化体系建设,对于应用开发来说,需要遵从分布式架构的接口、数据开发规范,同时应用的部署和运行方式需要满足自动化运维框架的要求。对于运维工程师来说,需要建立针对分布式资源池的部署运维规范、建立创新业务架构运营和短时高容量交易的管理策略,建立伸缩性架构平台及工具仓库,以及建立配套的人员知识体系。
通过这种规范化的自动化运维开发体系模式的建立,除了拥有了全面的 IT 整合能力之外,还为泰康保险的业务、开发团队带来 IT 基础设施以及开发平台的稳定性、可靠性、敏捷与灵活性,对整个业务部门带来了极高的性价比。
『充电时间』上海、杭州让大家久等了,实践课堂马上与你见面,快来现场吧!本次课程内容仍以技术实践为主,以用户场景为切入,主要围绕 QingCloud 的技术理念、功能特性和使用技巧展开,话题将涵盖如何高效构建原生云应用,云端容器部署,微服务架构,应用感知,自动化运维等业内热点话题。