
2.2 基本概念
2.2.1 客户终身价值定义
现阶段,不同的研究者对客户终身价值的定义会略有差别。从宽泛的方面讲,客户终身价值分为两个维度,即以客户为价值感受主体和以企业为价值感受主体。其中,以客户为价值感受主体是指客户是价值感受的主体,即认为顾客价值是顾客自己所认识到的价值,称为顾客的认知价值。以企业为价值感受主体,也即顾客对企业的价值,可以理解为每个购买者在未来可能为企业带来的收益总和,称为顾客终身价值。
针对以企业为价值感受主体这一维度,有很多研究者针对客户终身价值进行了更进一步的定义,即“一名客户未来在与企业保持交易关系中所贡献的所有利润的现值”。但是该定义在不同的文献中会略有差异。例如,Dwyer(1997)将其定义为一名客户为企业创造的预期收益(例如,毛利润)减去企业为此付出的成本(例如,服务和沟通的直接成本)的现值。Kumar、Ramani和Bohling(2004)将其定义为一名客户在其整个生命周期中为企业贡献的累计现金流的总和,其中,贴现率采用加权的平均资本成本。Berger和Nasr(1998)引用了Kotler和Armstrong(1996)关于盈利客户的定义:“一个人、一个家庭或者一家企业为企业创造的营业收入超过企业为此付出的成本(包括获取成本、销售成本和服务成本等)一定金额数量”,他们指出这部分超出的金额数量就是客户终身价值。
通过分析各个定义之间的差异,可以看到Dwyer(1997)认为一个客户的预期收益可以广义地理解为,既包括直接收益(客户贡献的直接收入),也包括间接收益(例如,口碑效应等)。并且,由于该定义只考虑了预期的收益和成本,从而忽略了过去的因素(例如,客户获取成本、已实现的客户收入等);Kumar、Ramani和Bohling(2004)则重点关注了客户的现金流而忽略了成本因素;Berger和Nasr(1998)则考虑了成本因素,其中包括客户的获取成本。
基于此,本书的客户终身价值定义是在Dwyer对CLV界定的基础上发展定义的,即认为客户终身价值可以理解为一个客户未来在与企业保持交易关系中所贡献的直接收益和间接收益。关于这个定义,有三点特征需要说明。第一,只考虑收益因素,不考虑成本因素。这主要是因为笔者在实证场景中没有获取到与成本相关的数据,但是由于这批样本中的消费者都是互联网用户,企业向每名用户付出的成本差异不会太大,所以仅考虑收益因素计算出的客户终身价值仍然具有很好的参考性。第二,只考虑客户未来的预期收益,不考虑已实现的客户收入。原因是,一方面计算已实现的客户收入的现值不需要建立预测模型,实施过程中没有任何难度;另一方面客户未来的预期收益存在不确定性,企业更加关注。第三,既考虑直接收益(即购买产生的价值),又考虑间接收益(即评论产生的价值)。
2.2.2 终身价值计算公式
通用的客户终身价值计算公式可以表示为

其中,pt表示在t时刻一名客户所付的金额;ct表示在t时刻服务该名客户的直接成本;i表示企业的资本成本或者折现率;rt表示在t时刻该名客户的重复购买概率或者保持“存活”的概率;AC表示获取成本;T表示计算客户终身价值的时间范围。
在这个通用的计算公式基础之上,学者们不断进行改进。Jung和Euiho Suh(2004)提出基于客户当前价值、潜在价值和客户忠诚的三维模型,该模型具体如下所示。



式中,ti为选择分析的服务客户i的时间周期;Ni为服务客户i总时间周期数;d为贴现率;E(i)为服务客户i时间周期数的期望值;πp(ti)为在时间周期内客户i的历史利润贡献;πf(ti)为在时间周期内客户i未来利润贡献;B(ti)为在时间周期内客户i的潜在价值;Pchurn为客户i的流失率。
随后,赵骅、夏秀兰(2005)在此基础上进行了改进,认为客户终身价值与购买价值和口碑效应价值有关,具体改进公式如下。

或写成

其中,ki为口碑效应参数;R1为客户i的过去利润贡献;R2为未来利润贡献。
范琳琳(2010)结合Pareto/NBD和BG/NBD模型将客户终身价值定义为
CLV=边际利润×次交易金额×预期交易次数的贴现值(DET)
其中,预期交易次数的贴现值(DET)可以由下式得到。

其中,分子表示t时间内客户的交易次数,d为贴现率。
结合本书采用的客户终身价值的定义,我们采用的客户终身价值计算公式为

在第2.6节中将对具体的计算进行详细描述。
2.2.3 CLV建模方法
计算客户终身价值从本质上说就是计算一种现值,计算公式比较容易理解和实施。真正的难点其实在于如何获取该公式的输入数据。由于输入数据涉及客户未来的购买次数、购买金额等信息,而产生这部分数据的交易行为还没有发生,因而只能通过构建模型进行预测。
为了解决这个问题,不同学者尝试过不同的建模方法,其中一些建模方法因其良好的预测效果和可实施性,被本研究领域的其他学者广泛认可和接受。归纳起来,较为通用的建模方法主要有以下6种:RFM模型、概率模型、计量经济学模型、持久性模型、计算机科学模型、扩散/增长模型等。下面对每种方法进行简要描述。
1.RFM模型
RFM模型是直销领域中一个非常经典的模型,它主要用于识别不同客户价值,帮助企业确定营销的目标客户。确定目标客户主要依据三个维度:最近一次购买时间(Recency)、购买频率(Frequency)和消费金额(Monetary),这也是RFM模型名称的由来。并且,Hughes(2005)指出,在这三个维度之中,对客户响应率最敏感的是“最近一次购买时间”,其次是“购买频率”,最后才是“消费金额”,所以在评判客户价值时,为这三个维度设定不同的权值。第2.3节详细论述了如何利用RFM模型,完成群体层面上的客户终身价值建模。
2.概率模型
所谓概率模型法,最直观的理解就是在模型的各项假设中使用各类概率分布进行刻画,由于不同的概率分布具有不同的数学特性,可用于描述在现实世界中所观察到的不同特征。
概率模型认为现实所观测到的行为都被看作是潜在随机过程的表征,而这些随机过程由潜在行为特质所控制,并且在个体之间存在差异[4]。概率模型法重点强调使用一个简单的故事来描述所观察到的现象(例如假设一个客户的生存时长服从指数分布),而不是像回归模型那样试图用带各种协变量的函数来解释所产生行为差异的原因。
如图2-1所示,客户的交易记录(包括过去已经发生的和未来将要发生的)是跟客户潜在行为特质(用θ表示)相关的函数。也就是说,past=f(θ),并且future=f(θ)。由于θ无法直接观测得到,只能假设θ在不同客户之间的异质性服从某种概率分布,通过利用历史数据进行拟合,再根据贝叶斯理论就可推断得到θ的估计值,最后将
代入原函数就可实现对未来交易记录的预测。
下面再深入解释该建模方法是如何应用各类概率分布完成模型假设的。
在客户基分析模型中,较为经典的概率模型包括:Pareto/NBD模型、BG/NBD模型、BG/BB模型等,这些模型通常从5个方面对客户的行为进行假设,具体包括:个体客户的购买行为服从某分布;个体客户的流失行为服从某分布;不同客户间购买率/概率的异质性服从某分布;不同客户间流失率/概率的异质性服从某分布;个体客户的购买率/概率和流失率/概率之间服从某分布。其中,假设一和假设二是关于个体行为的,假设三和假设四是关于群体异质性的,假设五是关于两种行为间的相关性的。

图2-1 概率模型法原理
在客户消费金额模型中,较为经典的概率模型包括:Normal-Normal模型、Gamma-Gamma模型等。这些模型通常从两个方面对消费金额进行假设,具体包括:个体客户每次消费金额服从某分布;不同客户间的消费金额均值服从某分布。假设思路与客户基分析模型基本一致,即先对个体用户特征进行假设,再对群体用户特征进行假设。
3.计量经济学模型
很多计量经济学模型的内在原理其实与概率模型是一样的。这类研究通常分别对客户获取、客户保留和客户扩展进行建模,然后再通过合并计算得到客户终身价值。
客户获取是指新客户的初次购买。该领域的研究主要关注新客户购买决策的影响因素。客户获取的基本模型通常是一个Logit模型或Probit模型。
客户保留是指一名客户“存活”或者重复购买的概率。客户保留的模型主要分为两类。第一类模型认为客户属于“永久性流失”型,通常使用风险模型预测客户流失概率。对风险模型可进一步可细分为:加速失效时间模型(Accelerated Failure Time,AFT)和比例风险模型(Proportional Hazard Model,PHM)。第二类模型任务客户属于“间歇性购买”型,通常使用迁移模型或者马尔可夫模型。
客户扩展是指一名客户在各时刻为企业创造的利润。该利润取决于客户过去的购买行为,以及企业促进客户的交叉销售和向上销售。客户扩展模型主要也分为两类:一类直接对利润进行建模;另一类间接对交叉购买进行建模。
4.持久性模型
与使用计量经济学模型计算客户终身价值相似,持久性模型同样侧重从客户行为的不同阶段(例如,客户获取、客户保留和客户扩展等)出发,分别进行建模。当具备足够长的时间序列数据时,这些不同阶段可以被看作是一个动力系统中的组成部分。在较为高级的多变量时间序列分析中,例如,向量自回归(VAR)模型、单位根检验理论和协整检验理论等,可以用来研究一个变量(例如,客户获取竞争或者客户服务提升)对系统中其他变量的影响,这种方法就被称为持久性模型。在客户终身价值建模中,持久性模型用于研究广告、折扣和产品质量对客户资产的影响,以及不同客户获取途径对客户终身价值高低的影响。
使用持久性模型的优势在于,它能很好地度量客户终身价值的长期表现。特别是,它可以量化长期客户资产发展中各种影响机制的相对重要性,包括客户选择、获取方法、口碑传播和竞争反应等。但就目前而言,该方法在客户终身价值建模中使用得还不多,部分原因是因为它对数据的要求较高,例如,等间隔观测的长时间序列。
5.计算机科学模型
营销学领域中的研究通常喜欢建立结构化的参数模型,比如之前提到的Logit模型、Probit模型和风险模型等。这些模型都有理论支撑(例如,效用理论),并且很容易解释。而与此相反,计算机科学领域(例如,数据挖掘、机器学习和非参数模型等)中的研究更侧重强调预测效果。计算机科学模型中的常用方法包括:投影寻踪模型、神经网络模型、决策树模型和基于样条的模型[例如,广义相加模型(GAM)、多元自适应回归样条(MARS)、分类和回归树(CART)和支持向量机(SVM)]等。
在客户终身价值建模领域,计算机科学模型更适合用于研究客户流失行为。使用该类模型的通常情况是,研究对象拥有非常多的变量,而数据的稀疏性将增大估计的偏差,导致传统的参数和非参数模型无法胜任。为了克服这些困难,Hastie和Tibshirani(1990)提出了广义相加模型,其中因变量的均值通过一个非线性、非参数的连接函数依赖于预测因子。另外一种方法是多元自适应回归样条(MARS),这是一个非参数回归过程,通过从数据中估计出具有断点的多个分段线性回归得以实现。
这类方法目前在客户终身价值建模中受到的关注程度相对较低,主要由于营销学领域的研究特别强调参数设置和可解释性。但是,随着企业内部信息技术不断提高,获取到越来越多的用户数据之后,这类方法值得进一步探索。
6.扩散/增长模型
客户终身价值体现的是个体客户长期的盈利能力,可以帮助企业进行客户选择、客户细分和客户定位。但这只是聚焦在个体层面,如果将企业所有客户的终身价值进行累加,即可从群体层面观测当前企业拥有的客户资源的状态,更具有战略意义。考虑到这一点,一些学者提出“客户资产”(Customer Equity,CE)的概念,即企业现有和未来客户的终身价值的总和。
要计算客户资产,首先要预测出企业未来的客户数量,而扩散/增长模型就是实现的途径之一。使用这种方法时,研究者首先建立模型完成客户数量预测,并允许在模型中加入营销组合协变量,提升预测效果,然后再建立模型完成客户资产的预测。
7.Gamma-Gamma模型
在具体介绍Gamma-Gamma模型之前,首先要对Normal-Normal模型进行综述。Normal-Normal模型是由Schmittlein和Peterson(1994)提出的,他们对之前提出的Pareto/NBD模型进行了扩展,即通过添加客户消费金额模型,最终完成了客户终身价值模型的构建。Normal-Normal模型的假设分为两个:第一,个体客户的消费金额服从正态分布;第二,不同客户消费金额均值服从正态分布。
虽然该模型在原文的实证中取得了不错的预测效果,但是后续学者也指出其存在一些先天的不足。在个体客户层面,服从正态分布的变量的取值可以为负数,而在现实生活中,消费金额必须是大于或者等于零的;在群体客户层面,在很多实证环境中,不同客户消费金额均值的分布往往呈现右偏,即绝大部分客户消费金额均值都处于较低水平,只有一小部分客户能承担高额消费,而正态分布呈现对称的钟形,无法准确刻画实际特征。
基于上述模型的不足,Colombo和Jiang(1999)提出了Gamma-Gamma模型。该模型分别将Normal-Normal模型假设中的两个正态分布替换为伽玛分布,不仅提高了模型的预测效果,更确保模型可以真实反映实际情况的特征。
使用Gamma-Gamma模型的另外一个优势是易于模型推导。Fader、Hardie和Lee(2005)指出,如果仅仅为了克服Normal-Normal模型的两个不足,同样可以尝试使用Lognormal-Lognormal模型。但是由于对数正态分布的卷积没有闭式表达式,因而也无法得到关于个体客户消费金额均值分布的闭式表达式。幸运的是,Gamma-Gamma模型不存在这一问题,因而被广泛采用。