相信对于单一变量原则指的是什么以及关于遵循单一变量原则是什么意思的话题,很多人网友都想了解,那就让小编带大家来解一下吧!
我是ZZ,点击上方“关注”,每天为您分享数据分析干货;私信我回复号码“01”,送你初学者数据分析大礼包。
工作中,除了同时进行两组实验AB外,还会存在同时进行多组实验的情况。在这种情况下,就无法使用之前的实验结果分析方法,而需要进行方差分析和检验。
1方差分析
方差分析主要用于检验多个整体均值是否相等,因此适用于均值指标,如DAU、人均使用时长等。
在多个总体的情况下,为了比较均值是否相等,需要进行多次z检验或t检验,这非常繁琐,并且会增加犯第一类错误的概率。方差分析提高了测试的效率,也增加了分析的可靠性。由于AB检验通常遵循单变量原则,因此我们仅介绍单因素方差分析。
11基本思想和原则
方差分析的基本原理是误差分解
总误差是数据的总误差;组内误差是每个样本内的数据误差;组间误差是不同样本之间的误差,组间误差包括随机误差和系统误差。
在方差分析中,数据的误差由平方和表示
误差分析如果不同群体之间没有差异,那么组间误差只包括随机误差,不存在系统误差,那么组间误差和组内误差之间的平均数据会非常接近,并且它们的比率将接近1,否则比率将大于1。当比率达到一定水平时,我们认为不同样本之间存在显着差异。
12个方差分析步骤
121假设
如果拒绝原假设,则认为不同样本之间存在显着差异。
第122章计算平方和
总平方和是所有观测值与总体平均值之间误差的平方和。
组间平方和是组均值与总体均值之间误差的平方和。
组内平方和是指各组内各数据与该组均值之间的误差的平方和。
其中,为总体均值,为第i个总体的样本均值,为第i个样本的样本量,为第i个总体的第j个观测值。
123建筑统计
由于每个误差的平方和的大小与样本的大小有关,因此需要对其进行平均,即平方和除以相应的自由度。这个结果称为方差。自由度为
SST:n是所有样本的数量
SSA:k个种群的数量
上交所
因此,当为真时,统计量服从分子自由度和分母自由度的分布。
124显着性检验
根据给定的显着性水平,在F分布表中查找分子自由度和分母自由度对应的临界值。
如果拒绝原假设,即样本总体之间存在差异。
如果,则不拒绝原假设,即总体之间不存在显着差异。
2测试
21基础知识
检验通过观测频率与预期频率的差异程度来判断总体之间的比例是否相等。
对于比例指标的AB实验,显着性检验可以等效为22路列联表的独立性检验。即一个维度是实验计划,另一个维度是第二天是否去参观。在这种情况下,测试和测试在数学上是等效的。
因此,在计算多个样本的比例指标的显着性时,可以使用卡方检验。
21假设
假设我们的样本数据如下所示
是否次日前往
计划1
场景2
选项3
全部的
是的
69
120
123
第312章
不
56
80
52
188
全部的
125
200
175
500
当零假设成立时,我们可以从样本数据中确定期望频率,然后使用检验统计量
确定观测频率与预期频率之间是否存在显着差异。如果差异显着,则将被拒绝,并且可以获得人口比例并非全部相等的证据。
22计算预期频率
通过观察上面观察频率的样本数据,我们可以看到,在所有500个用户中,有312个用户第二天会访客户端,所以是第二天可能访客户端的用户的总样本比例。如果我们假设原假设为真,即所有人群的比例相等,那么0624就是对第二天可能访该客户端的每组用户比例的估计。因此,如果为真,我们预计场景1的125个用户中,用户将在第二天访该客户端,而78是策略1的预期频率。
类似地,我们可以计算出每组的期望频率如下
23计算统计
式中,代表第i行第j列单元格的观测频率,代表第行列单元格的期望频率。在涉及人口比例相等的检验中,检验统计量遵循自由度分布,其中每个像元的预期频率为。
根据上面的公式,计算出的值为
最终统计值为789,
查找给定显着性水平的分布表中相应自由度的临界值。自由度为,R和C分别是行和列变量的数量,本例中分别为2和3,因此自由度为2。
如果拒绝原假设,即样本总体之间存在差异。
如果原假设未被拒绝,即群体之间不存在显着差异。
至此,AB测试的相关知识已经全部介绍完毕。如果觉得有帮助,可以通过点赞-分享-转发一站式帮助作者。
同系列文章
统计5|AB检验——方差分析和卡方检验
作者ZZ数据分析,网易高级数据分析师,专注于数据分析和数据科学知识分享。关注后请私信我,回复号码“01”,我送你数据分析师大礼包。
关于单一变量原则指的是什么的这类题,本文就关于遵循单一变量原则是什么意思的的相关内容进行详细的解,谢谢各位的支持!
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。