《计量经济学导论》读书笔记(四)(8)
the p-value is the probability of observing a t statistic as extreme as we did if the null hypothesis is true.
意思差不多是,如果原假设为真,那p值就代表着我们观察到的t值大于我们算出来的t值的概率。如果班级平均成绩对拖堂时间没有影响,那么p=https://wimgs.ssjz8.com/upload/1/62就意味着,假如我们把114514个数据分为62个样本,每个样本的容量为1847,那我们应该能在其中一个样本中观察到t值的绝对值大于2.326。同时,由(6)我们也可以想到,单侧检验的p值应该是其他条件相同情况下的双侧检验的一半。
顺带一提,一般来说,我们会用“我们无法拒绝原假设”这样的表述,而不是“我们接受原假设”,因为“接受”一般会被认为是“我们觉得β就是这个值”,但实际上,我们可以回归出无数个能通过t检验的β,难道我们要同时接受β=0和β=0.0000001吗?
介绍完了前面所说的“统计显著”,我们还应该了解什么是经济显著(economic significance)或者说实际显著(practical significance)。其实这就是很直觉性的东西,对没错,就是的大小。如果β=0.0001,se(β)=0.0000001,那么对于原假设:β=0来说,我们几乎可以在0%的置信度水平上拒绝原假设,换句话说,这个解释变量估计得那叫一个统计显著。但它的实际效应呢?假如班级平均成绩提高10000分,才会换来1秒的拖堂时间的延长,那这自然就不会被叫做经济显著。进而,这也要求我们注意变量的单位以及形式(比如对数形式),就比如说,如果班级平均成绩提高10000×0.0000001分,会换来1年的拖堂时间的延长,那你大概率是山泥若(?)
意思差不多是,如果原假设为真,那p值就代表着我们观察到的t值大于我们算出来的t值的概率。如果班级平均成绩对拖堂时间没有影响,那么p=https://wimgs.ssjz8.com/upload/1/62就意味着,假如我们把114514个数据分为62个样本,每个样本的容量为1847,那我们应该能在其中一个样本中观察到t值的绝对值大于2.326。同时,由(6)我们也可以想到,单侧检验的p值应该是其他条件相同情况下的双侧检验的一半。
顺带一提,一般来说,我们会用“我们无法拒绝原假设”这样的表述,而不是“我们接受原假设”,因为“接受”一般会被认为是“我们觉得β就是这个值”,但实际上,我们可以回归出无数个能通过t检验的β,难道我们要同时接受β=0和β=0.0000001吗?
介绍完了前面所说的“统计显著”,我们还应该了解什么是经济显著(economic significance)或者说实际显著(practical significance)。其实这就是很直觉性的东西,对没错,就是的大小。如果β=0.0001,se(β)=0.0000001,那么对于原假设:β=0来说,我们几乎可以在0%的置信度水平上拒绝原假设,换句话说,这个解释变量估计得那叫一个统计显著。但它的实际效应呢?假如班级平均成绩提高10000分,才会换来1秒的拖堂时间的延长,那这自然就不会被叫做经济显著。进而,这也要求我们注意变量的单位以及形式(比如对数形式),就比如说,如果班级平均成绩提高10000×0.0000001分,会换来1年的拖堂时间的延长,那你大概率是山泥若(?)