【游戏实战】用数学模型预测游戏留存和LTV

文章来源：infoqbilibili游戏算法团队

什么是 LTV？

用户的 LTV（生命周期价值）是游戏从用户获取到流失所得到的全部收益总和。在游戏行业，LTV 是大多数运营策略的最终衡量指标，也是一个游戏的价值体现，被广泛应用于广告推量投放的决策行为中。

LTV 的定义为用户生命周期价值（Life Time Value），其值大小由两部分决定：

a. 生命周期，即 Lt 部分

b. 价值，即 V 部分

放到产品中，即单个用户在产品中存活的时间乘以用户在存活时间期间内单位时间所付的费，用通俗的表达就是：

LTV = 单用户存活 Days *ARPU（per Day）

= 所有人在总存活期内总付费 / 所有人的人数

由于用户的存活行为是连续生成的，同时付费行为也是伴随存活行为连续生成的，所以 LTV 是一个【连续变化的积累值】，绝不是一个固定值。通常长成这个模样：

如何计算 LTV？

举个例子

某游戏 C，其每日的留存可以用 R(t)来表示（即 30 日留存为 R(30)），其每日的 ARPU 可以用 V(t)来表示（即第 8 天的 arpu 为 V(8)）。假设其在某一天中新增了用户 1000 人，这 1000 人在后续的 n 天中的表现为：

此时在这 n 天里，这 1000 人总计付费额度为：

所以此 1000 人的 n 日 LTV 为：

从上述公式中我们可以知道，LTV 只与产品本身的留存函数 R 和 ARPU 函数 V 有关，与具体的新增用户数量无关，是由产品本身决定的。

为什么要预测 LTV？

在游戏广告推量领域，如何进行高质量的推量投放以达到用户持续性增长的目标，是行业的普遍痛点。在传统的游戏广告推量行业中，投放及运营人员根据几款游戏的历史 LTV 数据，凭借长久的行业经验，对游戏未来的发展性价值进行评估；继而调整相应的游戏投放权重与力度，或进行相应的运营策略（如：开展活动）。随着市场规模扩大、用户群体复杂化，依赖行业经验的人为决策难度越来越大，对游戏及用户群体的价值进行准确评估的可行性也愈来愈低。因此，对于依赖数学算法的、可信的、拥有相对稳定准确性的 LTV 预估方法的开发研究，在游戏行业得到越来越多的重视。

LTV 作为衡量游戏中用户的价值的重要指标，在游戏评级、用户质量评级、用户增长等应用中具有至关重要的参考价值。历史的 LTV 数据与当前的 LTV 数据仅体现游戏发展至今的市场价值，而该游戏未来的市场效益是否能持续稳定发展、是否会陷入瓶颈甚至停滞，往往不得而知。相关人员仅依赖行业经验进行判断与决策将不可避免地伴随主观风险；加入数据分析与算法模型作为决策辅助可以降低决策风险、提高决策效益。

不同游戏的 LTV 直接影响其 ROI（投资回报率），体现游戏的市场价值。以游戏 LTV 的发展趋势与幅值为参考指标，对游戏进行评级，可以帮助游戏广告投放人员合理地调整不同游戏的资源投放比例；以用户群 LTV 的发展趋势与幅值为参考指标，对用户群的价值评估，可以帮助游戏广告投放人员合理地调整用于不同用户渠道的资源投放比例。

某些游戏在发布初期表现良好，之后在某一时间玩家开始大量流失，收益增长停滞，迅速进入瓶颈期。这样的发展趋势在初期也许稍显端倪，却容易被表面的良好数据掩盖（如，初期具有较高的留存率，但已出现异常的衰减情况）。此时运营人员再针对此情况商讨、研究、开发相应的运营策略，往往难以及时降低玩家流失。可预测未来 LTV 的算法模型可以为运营方提供游戏 LTV 在未来某时间段的潜在停滞风险，帮助运营方及时甚至提前做好调整运营策略的准备。

刚上线的产品，如何预测未来 LTV？

当产品上线后，根据已有的 LTV 数预测未来 LTV 走势和节点值，我们将会应用到——时序预测。

时序预测的思路主要是围绕四个部分来构建预测算法：趋势（T）、季节（S）、周期（C）、不规则波动（I）

时序预测的模型分为加法模型和乘法模型两种：

加法：Y=T+S+C+I

乘法：Y=T*S*C*I

考虑到 LTV 曲线本身的特性，其趋势（T）的影响占比非常非常大，而季节、周期和不规则波动影响非常非常小，所以从运营人员的角度出发，我们可以简化为 Y=T，直接找出符合 LTV 趋势的函数来做拟合，把时序预测领域的事情又变回为函数拟合的事情。

当然，对于数据分析方向的研究员在这个领域里可以使用更多更复杂的时序预测方法来预测未来的短期 LTV，但是通过函数拟合找到描述趋势的函数表达式，可以更有效的预测未来更长时间段内的节点 LTV 值。

对于充值包兑换率集中，玩家较稳定的游戏，我们可以取平均 ARPU 简化 LTV 公式：

为了更细致地把握留存率的变化对 LTV 的影响，我们试用通过拟合留存率来预测 LTV 的算法。首先拟合玩家的留存率，并预测出未来留存率的情况；再对留存率进行积分得到 LT（生命周期）；假设 ARPU 变化稳定（即使用其平均值），由 LT 乘 ARPU 即可得到 LTV 的预测值。

此算法通过优先拟合留存率，将各因素（如：活动）对留存率的直接影响体现出来，可以一定程度预测未来的留存率波动对 LTV 的影响。但是对于 ARPU 值变化较明显的情况不适用。

这里我们对于业界常用的几种函数进行了整理：

基于逻辑回归公式的逻辑模型：

基于反正切函数的反正切模型：

基于幂函数的模型：

在我们超过 100 个游戏的实验中，幂函数拥有最出色的拟合度和预测准确率：

模型偏差修正

仅仅使用幂函数对留存率进行拟合的方式适用于 arpu 稳定的游戏。如果游戏的 arpu 存在波动，则直接用均值代替会产生预测误差为了能将 ARPU 变化对 LTV 的影响体现，同时从宏观上修正拟合留存率时造成的 LTV 预测值和 LTV 真实值之间的偏差，在算法 3 的基础上我们采用对数函数

（其中 E 为偏差率，c、d 为常数）

拟合 LTV 真实值和 LTV 预测值之间的偏差率，即

我们使用接近真实偏差率的拟合偏差率 E，通过公式：

修正首次预测的 LTV，得到最终的预测 LTV。

此算法由于将留存率和 ARPU 对 LTV 的影响都考虑，具有更强的预测稳定性和普适性，同时也有更高的预测准确度。

在超过 100 个游戏的实验中，我们可以发现，在使用幂函数拟合留存率后，对 LTV 进行对数修正的方式，可以提高游戏 LTV 预测准确率，且准确率随训练数据天数增加而升高：

风险与对策

当前应用算法存在一定应用风险：若活动信息未知（前 7 日无活动对留存率造成波动），则不可预测未来的活动对留存率的影响。

对策：尝试使用历史同期活动影响情况来预测；尝试使用其他机器学习模型，将活动信息作为输入参数传给模型。

发表于: 2021-05-122021-05-12 17:22:20
本文为 InfoQ 中文站特供稿件
首发地址：https://www.infoq.cn/article/fc354a0af125e73afa04034eb
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

【游戏实战】用数学模型预测游戏留存和LTV

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐