t分布的一般公式
t=[x-μ]/[s/sqrt(n)]
t分布的一般公式
t = [ x - μ] / [s / sqrt(n)]
其中x是样本均值,μ是总体均值,s是样本的标准偏差,n是样本大小。
根据 中心极限定理,只要样本量足够大, 统计量的 抽样分布(如样本均值)将遵循正态分布。因此,当我们知道总体的标准偏差时,我们可以计算 z分数,并使用正态分布来评估样本均值的概率。
t分布允许我们使用正态分布对某些不适合分析的数据集进行统计分析。
T分布 (也称为学生T分布 )是一组分布曲线,看起来几乎与正态分布曲线相同,只是稍短而且较胖。 当您有小样本时,使用t分布而不是正态分布(更多信息请参阅: t分数与z分数 )。 样本量越大,t分布越像正态分布。 事实上,对于大于20的样本量(例如更多的自由度),分布几乎完全像正态分布。
t分配
在正态分布的介绍中显示,95%的正态分布面积在平均值的1.96个标准偏差内。因此,如果您随机抽取平均值为100的正态分布的值,则其在1.96σ为100内的概率为0.95。类似地,如果从人口采样n的值,所述概率样本平均值(M)将在100的1.96σM内为0.95。
如果你有一个正态分布但你不知道标准差的情况。你采样的N个值,并计算样本均值(M)和估计的平均值(σ的标准误差中号与多个)中号。M将在总体平均值(μ)的1.96 sM内的概率是多少?这是一个困难的问题,因为有两种方法可以使M从μ 大于1.96 sM。
(1)M偶然可能是非常高或非常低,
(2)sM偶然可能会非常低。
直观地说,有意义的是,平均值在1.96标准差内的概率应该小于标准差已知(并且不能低估)的情况。但究竟是多少小?幸运的是,解决这类问题的方法在20世纪初由数学家威廉·戈塞解决,他确定了均值的分布除 以其标准误差的估计值。这种分布被称为学生的t分布或有时只是t分布。威廉·戈塞在为爱尔兰一家啤酒厂工作时制定了t分配和相关的统计测试。由于与啤酒厂签订了合同协议,他以“学生”的笔名发表了该文章。这就是为什么t检验被称为“学生t检验”。
t分布的特质
(1) 以μ为中心左右对称
(2) 形状像钟形
(3) 两尾端向左右两端无限延伸
(4) 自由度df越大,曲线分散程度越小,即越高窄
(5) t分布的图形较N(0,1)来的矮宽