假设检验(Hypothesis Test),顾名思义,就是假设和检验,即寻找证据"检验"我们的"假设"是对是错
简述假设检验的步骤和基本思想
假设是相对于问题来说的,我们对于一个问题的答案有自己的预先判断(即假设)。而为了证明我们的判断是否正确,我们需要收集证据并根据一定的判断标准来证明它。所以,根据逻辑可以简单的把假设检验的过程分为4个步骤:
Step1,明确问题和假设
Step2,收集证据(p)
Step3,确定判断标准(α)
Step4,得出结论(根据p和α的对比)
现在我们举一个具体的例子来说明下每个步骤的逻辑推理是怎样的
Step1,明确问题和假设
比如说,我们现在想研究一个问题:使用头条APP的用户中男性多还是女性多?我们根据自己的经验预先判断这个问题的答案是:使用头条APP的用户中男性更多(即男性>女性)。而我们的判断的对立面是:使用头条APP的用户中男性不比女性用户多(即男性<=女性)
这样我们就得到了一个问题的2种答案,也就是2种假设(Hypothesis):
H0:男性<=女性
H1:男性>女性
我们把自己预先判断的答案叫做H1,而我们预先判断的对立面的答案叫做H0。可以看到H0和H1在逻辑上是完全互补的,也就是说如果我们能证明H0是错误的,那么我们的判断H1则是正确的!(为什么不直接证明H1是正确的,这是另一个话题,可以后续再讲...)
好了,我们的问题和假设都明确了,下一步要做的事情就是去收集证据去挑战H0,如果证据表明H0是错误的,那么就可以证明我们的判断(H1)是正确的了!
Step2,收集证据(p)
收集证据最直白的就是把所有使用头条的用户挨个询问一遍他们的性别,就可以得出问题的答案,但是很显然这个工作量是无法完成的,我们可以选择从所有使用头条的用户中抽取一部分用户来收集他们的性别,统计学上认为合理的足够多的样本可以代表总体情况
头条APP有100个用户(仅举例),我们从中随机抽取10个用户,询问他们的性别,按照H0假设这个结果应该大概率是5个男性5个女性。而我们的调查结果发现有7个男性,3个女性,出现这种情况的概率是0.113。也就是说在H0(5男5女)的情况下,出现了7男3女的概率是0.113。我们把这个概率叫做p值,而p=0.113
我们也可能会抽取出其他比例的结果,比如如果我们随机抽取的10个用户中有9个男性,1个女性,出现这种情况的概率是0.007,也就是说在H0(5男5女)的情况下,出现了9男1女的概率是0.007,即p=0.007
0.007是一个很小的概率值,可以说是小概率事件,小概率事件我们一般认为是不可能发生的,也就是说H0是不可能发生的,这个时候我们就可以得出结论:H0错误,从而我们的假设H1是正确的!
那么到底是出现0.113我们就可以认为是小概率事件,还是说出现了0.007才可以认为是小概率事件呢?
Step3,判断的标准(α)
承接上一步,当抽样的结果等于多少的时候我们可以认定是小概率事件呢?也就是说是在我们抽的10个用户中有7个男性的时候就可以判断H0是错误的,还是说当我们抽的10个用户中有9个男性的时候,我们才可以判断H0是错误的呢?这个值就是我们的判断标准,我们把这个标准叫做α!
一般来说统计学上把α定为0.05或0.01。如果我们取α=0.05(即我们做决策的标准),那么如果在假设H0的情况下我们的抽样结果的出现概率p<0.05(即α)时,我们就可以认为是出现了小概率事件,即H0是错误的!
Step4,得出结论(根据p和α的对比)
好的,现在我们的证据也收集了,判断标准也定了,把我们的收集的证据p和α做对比,就可以做出结论了!我们可以根据结论明确头条APP的用户是怎样的,可以针对性的做一些符合他们需求的产品决策...