第5章 多元统计分析
1什么是回归分析?回归分析的主要任务是什么?
答:(1)回归分析是用变量的观察数据拟合一个因变量与一个或几个自变量之间的关系,并用数学关系式表达这种关系;检验自变量影响的显著程度,比较各自变量作用的大小;进而用一个或多个变量的变化去解释和预测另一个变量的变化。
(2)回归分析的任务是:给出自变量x变化时,因变量y的平均值变化的规律;根据x值对y值作出预测。应该注意的是:回归分析不能确证变量之间的因果关系,只能确认自变量与因变量之间统计关系是否存在。
2什么是回归方程显著性检验和回归系数的显著性检验?
答:(1)回归方程的显著性检验
回归方程的显著性检验就是对回归方程是否真实的反映了变量间的线形关系进行检验。回归方程显著性检验有很多方法,回归系数b的检验、测定系数和相关系数的拟合程度的测定、回归方程整体检验判定、以及估计标准误差的计算等,这些方法均是检验回归模型的拟合优度方法。线性回归模型的有效性检验通常使用方差分析的思想和方法进行,具体步骤如下:
①平方和的计算
a.总平方和
b.回归平方和
c.误差平方和
SSe=SSt-SSR
②自由度的确定
a.dft=n-1
b.dfR=dft-dfe
c.dfe=n-2
③均方的计算
a.MSR=SSR/dfR
b.MSe=SSe/dfe
④F检验
F=MSR/MSE
查相应自由度的F值表,若F>F0.5,则说明回归方程是有意义的,否则回归方程无意义。
(2)回归系数的显著性检验
①在多元回归中,回归方程的显著性检验,不同于回归系数的显著性检验。多元回归方程显著,说明该回归方程至少有一个回归系数是显著的,但并不意味着所有的回归系数都是显著的。而在一元回归方程中,回归系数的显著性检验,与回归方程的显著性检验则是等效的。
②公式
式中
b是回归系数,SEb是回归系数的标准误,Se是误差的标准误。根据虚无假设上式中β=0。
如果求得的t值大于t0.05则说明回归系数是显著的。回归系数显著说明回归方程是有意义的。
3回归系数是按什么思路估计出来的?对回归系数应该作何解释?
答:回归系数是指在回归方程中,自变量x对因变量y变化的数量关系。通常用by·x表示以x预测y的回归方程的回归系数。
(1)回归系数是按照最小二乘法的思路估计出来的。即通过最小二乘法来使误差的平方和达到最小。其计算公式为:
(2)回归系数是回归直线的斜率,它表示自变量x变化一个单位时,y的平均变化。
4什么是确定系数?确定系数的大小有什么意义?
答:(1)确定系数,也叫测定系数,它是回归方程解释力的指标。确定系数指回归方程中,y变量的变异由x变量决定的比率,
即回归平方和在总平方和中所占比率。
(2)确定系数越大,说明回归效果越好。若比率是1,则表明总平方和全由回归方程所决定,回归效果极佳。若比率接近0,效果正好相反。确定系数可由x,y两变量的相关系数决定。因此在判断回归方程是否有意义时,不仅要看回归系数是否显著,更要看确定系数是否足够大。
5共变数分析的基本思路是怎样的?共变数分析与回归分析、方差分析有什么关系?
答:(1)在研究中常有共变因素影响实验结果。排除共变因素对研究所选择观测结果的影响的统计方法,称作共变数分析,又称协方差分析。在实验过程中对因变量有影响但是不是研究者感兴趣的因素,成为共变量或协变量。共变量分析的基本思路是将实验中未控制的无关变量对因变量的影响以协方差的形式排除掉,从而考查自变量对因变量的作用。共变数分析是实验研究中实施统计控制的重要方法。
(2)在共变数分析中,先是根据已有的x,y建立回归方程,然后根据回归方程所预测的相同x进行分析。将x的影响控制在最小水平。因此共变数分析与回归系数、回归平方和有一定关系。其实质上,是通过建立协变量对因变量的回归方程,通过确定系数计算出因变量的变异中,由协变量引起的部分,从而获得自变量对因变量的影响。