2015 年 11 月 28 日,架构与运维的年度大趴——又拍云架构与运维大会·北京站圆满落幕了。近 1500 名来自全国各地的 IT 小伙伴们让现场热火朝天,而 23 位享誉互联网技术业界的大神们的登场,龙图 VP 李翀在会上作了题为《数据化运营及云计算下的运维》,以下是分享实录:

image.png

龙图做了 8 年的游戏,真正快速发展起来是在移动互联网这个时代。随着刀塔快速的扩张,我们在各个领域都遇到了非常多的之前没有想到过的状态。发现云计算其实给我们带来了很多的便利,新融合包括价格等方面的优势。

大数据分析在游戏运营过程中的帮助

大数据是什么东西?今年 8 月份我们的用户数突破 1 亿,每天产生各种用户行为数据体量非常巨大。包括游戏中不同的用户行为,像付费、支付、消费对游戏内容的消耗。另外就是产生速度快,每天大概五六百万,同时在线百万量级。比较重要的一点就是用户的这些行为,其实可以给我们带来很多的可供挖掘的价值。

image.png

刀塔传奇遇上大数据,现在在整个运营和运维过程中,每天产生日志文件已经达到 T 级的水平。

大数据给我们带来什么样的挑战?从技术架构里面大数据分成三块,采集、存储、计算。在玩家手机客户端里面,在游戏服务器层面,通过什么样的方式来把玩家各种各样行为,包括说客户端还有服务器上面各种玩法、系统、活动采集到我们数据平台上去。MySQL 是静态分析的结果,Hadoop 主要是存储和计算我们的动态数据,还有包括定量的云存储、云计算。现在有三层,一层是以 Python 做静态报表分析,Hadoop 做分布式动态的数据统计。这些东西我们主要依赖于公有云和私有云系统上的计算。

数据挖掘有两个方面的含义,一是有效把数据利用起来,避免错误营销的数据给我们带来分析上和指导意义上的困扰。

image.png

第一点,在实践当中,我们发现数据量级出问题了。有一些数据供我们去使用,把无效虚假的数据给剔除出去。举例讲,当一款产品去运营的时候,会给我们带来大量用户,但是只注册,不玩游戏。假如不加分辨做数据的挖掘的话,我们会发现可能产品玩家的存留和玩家的付费率都是一个非正常的情况,比我们的期望值要低很多。

第二点,数据类型的丰富性也不再是问题。在游戏产品运营中,我们知道拿哪些类型的数据。这些代表性的特性和彼此之间的相关性产生的关系。

举一个小的例子,在一个产品的新上线阶段或者是在逐渐推广的阶段,我们可能更关注是产品的前端数据,包括产品从点击下载到注册激活一系列的转化率相关的数据。在整个玩家的行为周期里可以看到很多大量不同类型的数据,我们想通过从点击到下载的转化率,从下载到用户注册转化率,从注册到用户第二天登录的存留数据。

我们可以从这样的数据里面发现这个产品在当前的市场环境下处于什么样的水平,吸引什么样的用户,客户端大小在不同渠道上的表现,会对产品有什么样的影响,我们应该怎么调整产品。我们的目标是希望产品可以调的更好,更赚钱。

第三点,我们可以按照产品和用户的分类去建立服务器。比如男性用户或者女性用户对我们的游戏不同的付费内容,不同玩法,他的体验或者感受不一样。我们需要针对这些用户群体,分析他的数据,建立模型。把我们得到的结论、结果去推广到整个产品和要服务的人群当中。

CPS 模型和用户细分

这个其实是说我们怎么去在我们的运营的过程中运用我们数据统计、数据分析去有效的指导和帮助我们的运营部门去做好一个产品内容的推送,活动的设计。

image.png

首先 BI 报表系统是数据化运营的信息反馈平台。所有的运营通过备案系统看到问题,做预测和评估,根据我们之前所建立的产品和用户模型去分析什么样的用户可能会流失,什么样的用户面临不再付费的情况。传统报表是把数据,DAU、ARUP 值,上月和这月的变化,去年和今年的变化做比较。我们希望从基础的数据出发,通过数据模型观察到我们的产品有什么样的类型和机会,观察玩家未来有什么样的变化趋势,再转回到报表这样闭环的模型。

CSP (come-stay-pay) 就是免费的游戏让用户先玩,然后再购买服务的模式。围绕 Come 我们做的事情是这样,怎么样在不同的用户群落或是广告平台,渠道里面去做拉新的动作。因为刀塔手游阶段和运营更早一点像端游,渠道的力量蛮大的。我们至少有一半的用户来自于像 360、UC、小米这样的安卓渠道。怎么样去找到对这个游戏产品有兴趣的用户,我们希望通过数据模型,包括之前产品的经验,在对产品和用户去做一个画像,把适合的用户拉进来。

我们希望用户进来之后,玩了之后感兴趣,第二天第三天继续上线。不夸张的讲,我们中国的手游到今天已经不像去年,去年第一天下载并进入游戏的用户次日存留达到 60% 或更高。今天有多少?降到了 40% 甚至更低。

随着产业的变化,对运营的人和企业来讲,我们要做的事越来越多,面对用户不像专注于一款产品,我们在游戏新手环节,游戏前面的视频播放做更多的动作,做更多的调整,适应于现在更差的市场环境。针对不同的用户群落,针对用户支付能力要在游戏里面设计适合用户付费的内容。

image.png

用户细分的数据化运营,有一个二八原则,差不多 60%的收入是来自 5% 的高付费用户。大致来讲,从我们的刀塔和很多游戏的实践中验证这一点,游戏里有很多不差钱的人,我们大部分的收入就是来自这些很少量的高付费用户。剩下可能就是所谓中度付费用户,大概 30% 的收入来自 15% 的中度付费用户,10% 收入来自剩下 90%,可能这些用户里面真正有付费行为也就是 30% 左右。

不同的用户满足不同的特点,比如说我们高付费用户可能量很少,但是给我们贡献的 ARPU 值非常高,这些土豪非常的有钱,非常的任性,他投钱可以获得极大的炫耀的满足感这些独一无二的东西。对这些用户收入的挖掘和深耕上面,我们的关注度应该是最高的。

刚刚提到说流失预警,用户的流失是整个数据的 BI 体系里面所做的工作最多的一块。这些用户的流失,带来对收入的影响可以想像。中度付费用户占到接近一半的工作的重心所在。我们可能更关注的是流失的分析,集中在游戏设计缺陷的一种分析上。

我刚才讲过,现在手游的特点很像之前的端游,爆发式的推广期,这个阶段用户的增长会非常非常迅猛。后面跟端游不一样,端游一款产品五年或者十年以上的周期。手游爆发之后的平稳期,ARPU 值不像端游有那么强的存活期。我们后面数据挖掘运营,主要集中在尽可能的延长平稳期或者是长尾收入。这是刀塔传奇的付费人数生命周期的趋势。

其实数据化运营并不能让用户进入平稳期的产品再爆发或者怎么样,我们的目标是锦上添花,在一个同样的时间里获得更多的收入,拉长整个产品的收益周期。

image.png

流失预警的数据我们现在在用一个数据模型,三个月登录,一个玩家三个月没有登录你的游戏。七日未付费,这个玩家在七天时间里都没有给你充过值。产生的问题有几个原因,一个是筛选的用户比较多,不便于精准定位;第二是用户流失可能已经发生了,运营的可操作性比较差,我们没有好的办法解决已经流失的用户的情况。

根据我们游戏内的日志,玩家的行为描绘一个用户属于哪一类型,是什么样的特征。比如我们看到像首付时间、等级、付费频率、付费金额、登录频率等。随着一个玩家在一个游戏里时间周期越来越长,他会逐渐有付费金额大 R 到中 R 到小 R 的转移。刚开始花钱很猛,后面逐渐开始变成 30 元或者 6 元的付费,付费频率降低,登录频率降低。按照这几个点,可以按照月的纬度筛选出流失预警。这样会比我们之前提到的方案更具有可操作性。

image.png

总结一下,我们可以通过数据全面接触用户,更多的维度上把我们的数据进行综合利用。群体式运营从过去针对群体去推一样活动更精细化到针对不同的用户群体,有大 R、中 R、小 R,推不同的活动内容,改善用户的形态。将推销强制性卖给你变成营销,以用户需求为核心经营。我们知道用户在产品里面缺乏什么,我们通过付费或者免费的运营活动进行补充。

云计算下的游戏运维

早期的时候龙图是一家研发-运营公司。我们在腾讯游戏上运营过 QQ 九仙的产品。到了手游时代,我们发现龙图在当年并不算是一家非常大的公司,我们其实(规模)蛮小的。

现在我负责的平台和运营部门的规模也很小,我们怎么运营好达到亿级的产品呢?主要的受益是在云计算的使用。我们发现在手游阶段有一个特别巨大的特点,一个是用户量级增长非常非常迅猛,几个月的时间,一款产品的流水从几十万直接达到几千万或者更高。另一点对应我们的人力,比如几千万级的产品我们是否能够配置上百人的运维团队,老板当然不干,因为太贵了。

image.png

8 月份我们的云服务器保有量突破 1.1 万台,现在应该在 1.3 万左右。这样的保有量假如说我们去采购(物理服务器)然后上架的话,单次成本大家可能非常了解,非常庞大,我们其实很难预料说接下来业务会怎样的发展。我们到底花多少钱在这块才是比较合适。

云服务就会有些重大的优势。成本占用,IDC 会一次性采购大量的服务器,对应之后增或者减都是很麻烦的一件事,要机房上架。对应云计算我可以按月去付费,我想用就可以买,不用就可以回收掉。以刀塔为例,我刚才跟红点王总聊,我们刀塔这样一款产品,这款产品直接的运营人员是 5 个人,对应来讲(用物理服务器)我们一定会突破 20 个人员的规模。数据库等一些专业的 VPS 的实例,如果用传统的物理机一定会有大量专业的 DBA 人员帮我们优化去部署数据库。在云计算领域我们完全可以使用实例,MySQL 的实例根本不需要配置专用的 DBA 人员。

从开服来讲,申请机器几分钟搞定,传统 IDC 上架我想大家如果经历过零几年互联网,去机房,去上服务器的话,这种痛苦可能大家会有体会。我们一直期望云服务像自来水一样打开就可以用。基础的运维工作,比如像系统的搭建,系统的优化这些工作,我们都希望切到云服务去。我们的运维人员只需要去关注游戏构架的优化和游戏部署就可以了。

image.png

我们在整个平台搭建过程中遇到一个状况,之前在青岛机房线路出现一些问题,之后几周网络抖动非常严重。我们期望有什么办法能够把我们在青岛大概一百台左右的平台无缝迁移到杭州机房。如果在传统的物理机房的采购模式下,势必要在青岛这边保有这一百台机器,在杭州上台新的一百台机器再做迁移。

从云计算角度来讲,我们有一个巨大的好处,不需要长期的保有物理备份或者是机器。当发生问题的时候,我们启动异地漂移的动作,Web 和数据库服务器通过本地克隆的方式迅速扩展开来。实际从开始部署到实际迁移测试,我们用 30 分钟,玩家对平台响应的感知是无缝的,他们感觉不到任何的变化。

游戏行业整个变化和角度越来越快的时候,云计算下的游戏运维带来了几点好处:一是快速和巨量增加;第二是游戏架构部署之前的事情无须操心。第三在业务允许范围内,我们平均成本或者一次性投入成本少,小成本可做大事。