商业分析方法与模型
提升用户转化(付费)
提高电商平台的订单转化率,我们需要从三个方面入手:商品分析、用户分析和归因分析。
1. 商品分析
1.1 转化路径分析
电商购买流程的主路径为:
针对关键路径转化“UV-点击”、“点击-加入购物车”、“购物车-支付成功”,不同商品的转化率进行比较分析,监测SKU的更新变化。
1.2 商品分类分析
根据商品品类的转化率,利用波士顿矩阵将商品品类分成以下4种。
- 导流型品类:利润非常低,但是购买量大、市场需求大,目的在于导流。
- 高利润型品类:利润率高,希望用户更多购买此类商品。
- 高转化品类:带量。
- 未来明星型品类:这是电商平台的潜力股,虽然曝光量很低,但是转化率极高。
上图的波士顿矩阵,横坐标代表商品的曝光量,纵坐标是商品的转化率,图中的每一个圆圈代表一个品类的商品。右上角的商品品类曝光量大、转化率高,是现金流的重要业务;而左上角的商品虽然曝光率非常低,但是转化率极高,属于我们上面提到的未来明星型品类,对于这一类商品,我们在后期的运营中可以增加其曝光量。
V1版
依据波士顿矩阵,从曝光量 -> 转化率 -> 回购率三个方向对商品进行划分,将商品分为八类。
定义:
- 曝光量:两周内商品的曝光次数
- 转化率:两周内商品的订单转化次数/点击次数
- 回购率:两周内转化的商品在未来一周内产生复购的量/两周内的转化量
商品划分后,可拆分如下商品转化路径,不同转化都存在对应策略。
2. 用户分析-精准营销
通过用户全生命周期精准营销和精细化运营,提升用户增长的北极星目标,其场景和流程如下图所示:
2.1 Lookalike算法
Lookalike的目的是基于目标人群,从海量的人群中找出和目标人群相似的其他人群,分为显示定位和隐式定位。
2.1.1 显式定位:根据用户画像标签筛选
建立用户画像体系,对人群进行细分并添加标签,电商平台画像可从用户特征,商品特征和渠道特征三个方向建立:
2.1.1.1 用户特征
2.1.1.2 商品特征
2.1.1.3 渠道特征
2.1.2 隐式定位
通过机器学习、深度学习的方法,对种子用户进行建模,然后用模型去识别。
2.1.2.1 基于相似度模型
基于User-User之间的某种距离大小来衡量用户之间的相似度。
计算完个体之间的距离后,再计算个体和样本的距离,来确定个体属于哪个种子用户
2.1.2.2 基于分类模型
将look-alike看成是分类问题,很多的分类算法都可适用,例如LR算法,XGB模型和RF模型等。
LR算法
将种子用户作为正例,将随机用户进行降采样后作为负例,为每个种子训练一个LR模型。用这个模型在全部用户上预测,后去判断其他的用户是否为目标人群,模型如下:
2.2 uplift模型
通过uplift定位产品策略的受益人群,针对persuadable人群进行下发,保证营销效用最大化。
2.3 个性化推荐-千人千面
“千人千面”是指结合依靠电商平台庞大的数据库,从细分类目中抓取那些特征与买家兴趣点匹配的推广宝贝,为展现在目标客户浏览的网页上,帮助您锁定潜在买家,实现精准营销。
依托用户画像,每个消费者只要有在电商平台上购买或是浏览过,就会给用户打上标签,比如年龄、喜好、关注点等。标签的不同,千人千面展示下看到的产品就会有所差别。就像两个男生从来没有买过女性产品,但是第一次给女性买东西,搜索同一个关键词比如连衣裙 女,那么看到的也不一样,平台会根据你以往的一些购买行为打上标签,比如是年轻,高客单的,那么展示在你面前的连衣裙也会投放与这些标签相似度比较高的产品,这就是千人千面深入一步的展示。
2.3.1 协同过滤
- 基本思想:我们想给用户推荐东西,最合乎逻辑方法是找到具有相似兴趣的人,分析他们的行为,并向用户推荐相同的项目。另一种方法是看看用于以前买的商品,然后给他们推荐相似的。
- 包括基于用户的协同过滤(下图左)和基于项目的协同过滤(下图右)。
V1
使用基于项目的协同过滤,构建商品之间的相似度库,
2.3.2 矩阵分解
- 基本思想:矩阵分解,直观上来说就是把原来的大矩阵,近似分解成两个小矩阵的乘积,在实际推荐计算时不再使用大矩阵,而是使用分解得到的两个小矩阵。
- 优点:1.比较容易编程实现,随机梯度下降方法依次迭代即可训练出模型。比较低的时间和空间复杂度,高维矩阵映射为两个低维矩阵节省了存储空间,训练过程比较费时,但是可以离线完成;2.预测的精度比较高,预测准确率要高于协同过滤以及内容过滤等方法。3. 扩展性好。
- 缺点:1.模型训练比较费时;2.推荐结果不具有很好的可解释性,分解出来的用户和物品矩阵的每个维度无法和现实生活中的概念来解释,无法用现实概念给每个维度命名,只能理解为潜在语义空间。
3. 归因分析
电商坑位归因的概念,把每一笔的成交都归给转化路径中不同的坑位。根据坑位的曝光转化价值来评判坑位的好与坏。把宝贵的流量尽可能都引导到转化率更高的坑位,以此达到精细化运营的效果。归因模型包括以下几种:
3.1 首次触点模型
- 定义:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为第一个「待归因事件」功劳为 100%。
- 优点:是一种容易实施的单触点模型
- 弊端:受限于数据跟踪周期,对于用户路径长、周期长的用户行为可能无法采集真正的首次互动。
- 适用于:这种模型适用于没什么品牌知名度的公司,关注能给他们带来客户的最初的渠道,对于扩展市场很有帮助的渠道。
3.2 末次触点归因
- 定义:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为最后一个「待归因事件」功劳为 100%。
- 优点:首先它是最容易测量的归因模型,在分析计方面不容易发生错误。
- 弊端:末次渠道的功劳评估会被大幅高估,真实的用户行为路径更接近于产生兴趣、信任、购买意向、信息对比等各种环节,这些都是其他渠道的功劳,在这个模型中则无法统计进来。
- 适用于:转化路径少、周期短的业务,或者就是起临门一脚作用的广告,为了吸引客户购买,点击直接落地到商品详情页
3.3 线性归因
- 定义:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为每个「待归因事件」平均分配此次功劳。
- 优点:他是一个多触点归因模型,可以将功劳划分给转化漏斗中每个不同阶段的营销渠道。另外,他的计算方法比较简单,计算过程中的价值系数调整也比较方便。
- 弊端:很明显,线性平均划分的方法不适用于某些渠道价值特别突出的业务。
- 适用于:适用于企业期望在整个销售周期内保持与客户的联系,并维持品牌认知度的公司。在这种情况下,各个渠道在客户的考虑过程中,都起到相同的促进作用。
3.4 时间衰减归因
- 定义:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为越靠近「目标转化事件」做出的贡献越大。
- 优点:相比线性归因模型的平均分权重的方式,时间衰减模型让不同渠道得到了不同的权重分配,当然前提是基于“触点离转化越近,对转化影响力就越大”的前提是准确的情况下,这种模型是相对较合理的。
- 弊端:这种假设的问题就是,在漏洞顶部的营销渠道永远不会得到一个公平的分数,因为它们总是距离转化最远的那个。
- 适用于:客户决策周期短、销售周期短的情况。比如,做短期的促销,就打了两天的广告,那么这两天的广告理应获得较高的权重。
3.5 位置归因
- 定义:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为第一个和最后一个「待归因事件」各占 40% 功劳,其余「待归因事件」平分剩余的 20% 功劳。
- 混合使用了首次互动归因和末次互动归因.
- 适合:十分重视线索来源和促成销售渠道的公司
3.6 马尔科夫链
- 马尔科夫链(Markov Chain),描述了一种状态序列,其每个状态值取决于前面有限个状态,马尔科夫链是具有马尔科夫性质的随机变量的一个数列。
- 马尔科夫链归因模型实质上是一种以数据驱动的(Data-Driven)、更准确的归因算法。访客下一次访问某个渠道的概率,取决于这次访问的渠道
- 马尔科夫链归因模型适用于渠道多、数量大、有建模分析能力的公司。
总的来说,没有完美的归因模型。任何模型都存在他的局限性和不足,如何有效地结合客观数据与主观推测,是用好归因模型的重要能力前提。
V1
波士顿矩阵
从曝光量 -> 转化率 -> 回购率三个方向对商品进行划分,将商品分为八类。
定义:
- 曝光量:两周内商品的曝光次数
- 转化率:两周内商品的订单转化次数/点击次数
- 回购率:两周内转化的商品在未来一周内产生复购的量/两周内的转化量
商品划分后,可拆分如下商品转化路径,不同转化都存在对应策略。
基于项目的协同过滤
1.收集用户购买信息,构建user-item矩阵
2.针对项目的最近邻搜索
先计算已评价项目和待预测项目的相似度,并以相似度作为权重,加权各已评价项目的分数,得到待预测项目的预测值。例如:要对项目 A 和项目 B 进行相似性计算,要先找出同时对 A 和 B 打过分的组合,对这些组合进行相似度计算。
3.产生推荐结果
以项目为基础的协同过滤不用考虑用户间的差别,所以精度比较差。但是却不需要用户的历史数据,或是进行用户识别。对于项目来讲,它们之间的相似性要稳定很多,因此可以离线完成工作量最大的相似性计算步骤,从而降低了在线计算量,提高推荐效率,尤其是在用户多于项目的情形下尤为显著ds
转化路径
不同商品生成转化路径分析,找出影响最终支付完成的转折点。