0%

1.中心极限定理

1.1 定义

中心极限定理指的是给定一个任意分布的总体。我每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。 然后把这 m 组抽样分别求出平均值。 这些平均值的分布接近正态分布。

阅读全文 »

1. EM算法统计背景

EM算法是一种迭代优化策略,由于它的计算方法中每一次迭代都分两步,其中一个为期望步(E步),另一个为极大步(M步),所以算法被称为EM算法(Expectation-Maximization Algorithm)。EM算法为了解决数据缺失情况下的参数估计问题。

阅读全文 »

我们做AB实验的时候,经常能看到这样一个指标:统计功效(power),或者是它的变体()。
那么,这个所谓的统计功效到底是个啥呢?要理解功效,我们首先得理解两类统计错误。

1. 两类统计错误

阅读全文 »

1. 假设检验

T检验是统计推断中非常常见的一种检验方法,用于统计量服从正态分布,但方差未知的情况。

t检验三种常用类型及其应用领域:

  • 单样本均值检验(One-sample t-test):用于检验 总体方差未知、正态数据或近似正态的 单样本的均值 是否与 已知的总体均值相等;
  • 两独立样本均值检验(Independent two-sample t-test):用于检验 两对独立的 正态数据或近似正态的 样本的均值 是否相等,这里可根据总体方差是否相等分类讨论;
  • 配对样本均值检验(Dependent t-test for paired samples):用于检验 一对配对样本的均值的差 是否等于某一个值;
    阅读全文 »

提升用户转化(付费)

-w300
提高电商平台的订单转化率,我们需要从三个方面入手:商品分析、用户分析和归因分析。

阅读全文 »

1. 背景

目前小流量实验存在的问题:

  • 小流量实验结论负向和持平偏多,产品优化策略无法获得正反馈。
  • 对照组和实验组流量都是随机划分,无法定位到真正受益人群。
    阅读全文 »