2017 年 8 月 26 日,又拍云第 35 期的 Open Talk 活动 “ 精益运维与 DevOps 最佳实践 ”落地广州,魅族运维架构师陈琛作了《 魅族云平台建设》,以下是分享实录:
那些云平台踩过的坑
魅族云平台在建设中遇到过许多挑战,如:高可用方案的选择,如何保证业务可用性达到99.99%;如何保障业务的持续和快速交付;网络和存储的选型及优化。本次分享 魅族运维架构师陈 琛围绕魅族云平台建设中遇到的问题和挑战与大家进行了共同探讨。
魅族云采用的是IAAS平台,是基于KVM,进行整合计算、存储网络资源的一项云存储平台,每个云主机运行指定的操作系统,提供8种业务模版。具有分钟级升级内存和CPU垂直扩展以及分钟级交付虚拟机水平扩展的弹性伸缩功能。从软件包管理,配置管理,到服务器管理来实现魅族云的持续交付功能。
在效果方面,魅族云具有分钟级别的弹性伸缩能力,但在未来,他希望通过类似外部的(192:55)或者其他一些监控具有报上一些虚拟机的监控数据的能力,能够监控虚拟机CPU负载或者类似于每秒的接收请求数,或者类似于其他的一些监控指标,根据相关策略的话来实现自动伸缩。
在持续交付方面,魅族云实际交付给用户的是镜像或者镜像组,会有一些基准镜像比如(195:28)等等。但每个业务可能会有自己的定制需求,这个时候,通过基准镜像添加一些配置脚本来实现安装和配置。最终给到用户的就是一个基准镜像加一个定制过后的一个镜像,然后可以批量去生成主机或者主机组。
说到网络优化上的一些选型经验,KVN原生的网络虚拟化方案是全虚拟化方案,也就是说一个包到达虚拟机的网卡比如物理机网卡,是需要经过虚拟网卡,虚拟化程,内核网桥,最后才能到虚拟网卡,整个流程很长,而且性能也不是很好。像原生的1亿千网卡,在千兆环境下它的吞吐量可能只能到百兆网卡的水平。目前对网卡的优化一般有四种方式,分别为:virtio、vhoct-net、mactap和SR-IOV。
最后,他希望实现通过结合大数据,以互联网产品为支撑,在细分市场上提供云服务,形成一个整体的循环过程这样的愿景。