第4章 研究结果的整理与分析
1名词解释
(1)集中量数
答:集中量数是用于描述数据的集中趋势的统计量。常用的集中量数有算术平均数、中数、众数、几何平均数、调和平均数、加权平均数等。集中量数可说明一组数据全体的典型情况,描述研究对象的一般水平,也可以进行组间比较,以判明一组数据与另一组数据的数量差异。每一种集中量数都有其特点,适用于不同的情况,不能单独对某一统计资料作充分而完全的说明。
(2)参数估计
答:参数估计是推论统计的一种形式,指根据从总体中抽得的样本,对总体分布的未知参数进行估计的过程。参数估计包括点估计与区间估计。点估计就是在总体参数未知时,用一个特定的样本统计量估计总体的过程。区间估计是指用一个置信区间估计总体参数的过程。
(3)正态分布
答:正态分布是一种重要的连续型随机变量的概率分布,又称常态分布、高斯分布。其概率密度函数为:
记作X~N(μ,σ2)。它有两个参数μ,σ2,其中μ是该分布的均值,σ2是该分布的方差。正态分布的形式是对称的,对称轴是经过平均点的垂线,正态分布中央点最高,然后逐渐向两侧下降。许多常见的变量,如测量误差、人的身高、体重、智商等都服从正态分布。
(4)方差分析
答:方差分析是将因变量的总变异或方差分解成若干不同来源的变异或方差,并利用方差差异显著性检验来考察各自变量的主效应及交互作用是否显著,进而推断各处理组的总体平均数差异是否显著的统计方法。方差分析中可能的变异源有实验处理变异、无关变量引起的变异以及实验误差等。方差分析的使用条件是:总体正态分布,变异是可加的,各处理内的方差一致。方差分析的种类有单因素方差分析、协方差分析和多元方差分析。
(5)回归分析
答:回归分析是通过观测值寻求一个或数个自变量与一个因变量之间的函数关系的一种统计方法。回归分析的基本思路是根据多次观测值计算出回归系数,建立回归方程并进行回归系数的显著性检验。根据自变量是一个还是多个,回归分析可划分为一元回归分析和多元回归分析。一元回归分析只能处理一个因变量和一个自变量的关系,并根据回归方程由自变量推测因变量。多元回归可决定一个因变量和多个自变量之间的关系,通过建立多元回归方程式,对未知的因变量做出预测。
(6)路径分析
答:路径分析是研究变量之间的因果关系的数学分析方法,它是多元回归分析的一种形式。路径分析的特点在于能够对变量之间的相关进行数量性的分解,即将相关系数分解为直接效应、间接效应、归于相关原因和归于共同原因,因而能更好地解释变量之间的关系,指出各个自变量对因变量的相对重要性。
2试论心理学研究中定量分析与定性分析的关系。
答:在心理学研究中,定量分析与定性分析都具有十分重要的地位,两者缺一不可。
(1)定量分析是现代心理学研究的必备工具,心理学研究成果通常以定量分析的方式表现出来,不懂得定量分析就难以了解他人的研究进展,也难以确定自己的研究方向并进行深入的研究。
(2)定量分析要以定性分析为基础,以心理学理论为基础,只有在正确的观点和思想方法指导下的定量分析才是有用的。定量分析是为了揭示数据的特征和规律性,因此,这种定量分析的方向、范围须由定性分析来规定,而不是由研究者随意确定。脱离了定性分析的统计分析只是“无本之木”,“无源之水”。定量分析得出的规律或特征也需要借助于心理学理论才能科学地解释。
(3)对心理学研究的结果必须进行定性与定量两方面的分析,才能揭示心理与教育现象的本质和规律。定性分析与定量分析应该是相互补充,相辅相成的。
3编码的含义是什么?怎样设计编码系统?
答:(1)编码的含义
编码是将研究所获得的资料转换成计算机可识别的数字,形成码值的过程。心理学研究中使用的码值有两种:其一为数码,本身具有数学意义,能进行计算;其二为代码,本身无数学意义,只能作为分类或分组的一种代号。
(2)设计编码系统的步骤
编码系统包括编码指导手册和编码表,因此编码系统的设计即编码指导手册和编码表的设计。编码指导手册是编码的要求和依据,它包括变量的分类和答案代码。编码表则是根据编码指导手册绘制的、可供编码者对研究资料进行编码的表,它必须包括所有的变量和代码。
①编码指导手册的设计步骤
a.详细列出研究涉及的变量。将研究设计时所考虑的变量和研究过程中新增减的变量全部列表排出,根据研究结果决定取舍。
b.将反应或答案分类。研究者将被试对每个问题、测试的反应或答案逐一分成不同的类别。分类同时应包括对非研究变量,如被试性别、年龄段、学校类别等的分类。
c.规定代码。给变量、不同类别的反应规定一个代码,编制编码说明。应注意同一变量的不同答案类别中不能出现相同的代码,但不同变量的不同答案类别可以有相同代码。
d.举例说明编码手册的使用。结合研究的实际情况举例说明如何使用编码手册及注意事项,有些研究也可以不举例说明。
e.预试检验,修改完善。编码指导手册编制完毕后,应要求编码者进行预试,检验编码部分材料。发现问题、遗漏时应及时修正、补充,使编码手册完善起来。
②编码表的设计步骤
绘制编码表的最基本要求是准确完整地反映编码指导手册。编码表必须包揽变量表和代码表的全部内容,使研究结果中的任一部分都能在其中找到合理的位置。此外,编码表还必须清晰明确、便于编码者进行编码。编码表的绘制遵循一般表格的绘制要求。
4假设检验的基本步骤有哪些?
答:假设检验的基本步骤包括:
(1)根据问题要求,建立虚无假设H0和研究假设H1。假设检验的基本思想是概率性质的反证法。在虚无假设为真的前提下,如果有违反逻辑或违背人们常识和经验的不合理现象出现,则不能接受虚无假设,若没有不合理现象出现,就可以接受虚无假设。
(2)选择适当的显著性水平α,并根据检验的类型查出临界值。在假设检验中有可能会犯错误。如果虚无假设正确却把它当成错误的加以拒绝,犯这类错误的概率用α表示,α就是假设检验中的显著性水平。显著性水平确定以后,拒绝域也随之而定,而且对于不同的假设形式,拒绝域是不同的。显著性水平的大小应根据研究问题的实际情况而定,对于接受备择假设而言,若要求结果比较精确,则显著性水平α应小一些;反之,若要求结果不那么精确,则α可稍大一些。值得注意的是,显著性水平的大小有时会影响假设检验的结果。
(3)计算检验统计量的值。根据样本资料计算出检验统计量的具体值。
(4)比较临界值与统计检验值并进行决策。根据显著性水平α和统计量的分布,查相应的统计表,查找接受域和拒绝域的临界值,用计算出的统计量的具体值与临界值相比较,作出接受虚无假设或拒绝虚无假设的决策。若临界值大于统计值,则接受H0,拒绝H1。反之,则拒绝H1,接受H0。
5共变数分析适用于哪些资料?
答:在研究中常有共变因素影响实验结果。排除共变因素对研究所选择观测结果的影响的统计方法,称作共变数分析,又称协方差分析。所适用的材料为每个研究的观测变量都有一个共变量结果(X),如前测、智力、年龄等等。数据的形式为每一个被试除实验观测变量y外,还有一个需要控制因素的观测变量(X);如下表:
6聚类分析适用的资料特点是什么?
答:聚类分析又称分类分析、集群分析,是将所观测的事物或观测事物的指标进行分类的一种多元统计方法。适用的资料:要求事先知道测试对象的类型,各种测试资料或每一测试对象的多项目观测数据,一般情况下这些数据是等距的测量数据。测试单位可以相同,也可以不同。
7聚类分析的基本统计思路是什么?
答:聚类分析的基本统计思路是:依据的原则是同一类中的个体有较大的相似性,不同类的个体差别比较大。距离近的样品(或变量)应该归在一起,这里的“距离”指的是样品(或变量)之间的相似度。也就是说,相似度大的,可以归成一类。衡量两个样品之间的距离的方法是:设每个样品之间的距离就是p维空间中两点之间的距离。衡量两个变量的距离的方法是定义变量间的相似系数,相似系数最接近的两个变量相似性最大,可以归为一类。积差相关系数往往用来作为变量之间的相似系数。
8判别分析适用的资料特点是什么?
答:判别分析是以已掌握的不同类别的样品为标准,结合所观测的不同样品的若干项不同的观测指标数据,建立一个或多个线性组合,称为判别函数,将尚待判断的事物加以判别分类的一种多元统计方法。适用资料为:已知所需判别的类型以及关于各类型的多项测试的有关测试数据,据此建立判别模型,然后对未知的测试对象或指标进行类型判别。
9判别的基本统计思路是什么?
答:(1)判别分析的基本统计思路是:已知n个总体,其分布函数分别为:F1(X)、F2(X)、F3(X)……Fn(X)。每一个总体都是一个p维函数。对于给定的样品x,应通过判别函数(判别准则),来决定该样品应属于这n个总体中的哪一个总体。
(2)判别分析的过程分为两部分,首先是依据已知样本及其预测变量建立起一系列分类规则或判别规则,其次是运用这一规则对样本的原有分类进行检验以确定原有分类错判率。同时如果原有分类具有较低的错判率,则建立起来的分类规则可以运用。用于判别的准则-判别函数,应是最优的,其误差的概率应最小,错判的损失应最低。常用的判别方法主要有距离判别、Bayes判别和Fisher判别。
以距离判别为例,距离判别是以给定样品与各总体间距离的计算值为准则进行类别判定的一种方法。对于样品与各个总体的相应距离中,以距离最近的一个总体作为判别的准则,即给定的某一样品,应属于与之距离最近的一个总体。为了进行距离判定,应计算样品与各总体间的距离。距离判别中,往往使用马氏距离。两点间的马氏距离与原始数据的测量无关,可排除变量间相关性的干扰,它给距离的计算带来了很大的方便。
10回归分析与判别分析的区别是什么?
答:回归分析与判别分析的区别是:
(1)两种分析的目标和适用条件不同
回归分析是多元统计分析的一种,在相关变量中将一个变量视为因变量,其他一个或多个变量视为自变量,建立回归模型并利用样本数据进行分析。用于分析变量之间共变关系,旨在确定变量间共变关系的数学模型,即回归模型,从而分析一个变量的变异在多大程度上可由其他变量的变异来解释或预测。变量应为等距或等比的测量数据。
判别分析用于判别样品所属类型。在判别分析中,已经知道观测对象的分类和若干表明观察对象特征的变量值,判别分析就是要从中筛选出能提供较多信息的变量并建立判别函数,并把新的样品归入已知类中的一个。
(2)两种分析的基本统计思路不同
回归分析的基本统计思路:利用样本观测数据,求解正规方程组得到用一个或一组自变量的关系式表示因变量估计值的方程式。通过回归方程可由给定的自变量的值预测因变量的值。常用的回归方程的解法是最小二乘法。
判别分析的基本统计思路是:已知n个总体,其分布函数分别为:F1(X)、F2(X)、F3(X)……Fn(X)。每一个总体都是一个p维函数。对于给定的样品x,应通过判别函数(判别准则),来决定该样品应属于这n个总体中的哪一个总体。
11简述因素分析的原理与过程。
答:因素分析的原理与过程是:
(1)因素分析的原理
因素分析是从众多的可观测变量中概括缩减出少数起主导作用的共同性变量(因素),用以解释最大量的观测事实的统计分析技术。在多变量关系中,变量间线性组合对表现或解释每个层面变异数非常有用。变量的第一个线性组合可以解释最大的变异量,排除前述层次,第二个线性组合可以解释次大的变异量,最后一个成份所能解释总变异量的部份会较少。主成分数据分析中,以较少成分解释原始变量变异量较大部份。成分变异量通常用“特征值”或“潜在本质”表示。因素分析是一种潜在结构分析法,其模式理论中,假定每个指针(外在变量或称题项)均由两部分所构成,一为“共同因素”、一为“唯一因素”。共同因素的数目会比指针数(原始变量数)还少,而每个指针或原始变量皆有一个唯一因素,亦即一份量表共有n个题项数,则会有n个唯一因素。唯一因素性质有两个假定:所有的唯一因素彼此间没有相关,所有的唯一因素与所有的共同因素间也没有相关。至于所有共同因素间彼此的关系,可能有相关或可能皆没有相关。在直交转轴状态下,所有的共同因素间彼此没有相关;在斜交转轴情况下,所有的共同因素间彼此就有相关。
(2)因素分析的过程
因素分析的基本过程如下:①收集数据,形成关联性测度数据;②抽取因素,即将方差矩阵或协方差矩阵进行处理,求得初始因素解,其中主要有主成分分析法、最小二乘法、最大似然法等;③因素轴的旋转变换与解释,即将初始因素解进行因素轴旋转求得最终因素解,并对其意义进行解释,因素的解释应以研究的理论假设和实际因素负荷为基础,从最大负荷的变量得出因素的主要含义。
12因素分析的意义有哪些?
答:因素分析的意义有:
(1)可以帮助研究者发现规律。从众多的观测指标中抽取不同的因素,可帮助研究者确定特质的维度,认识其内部的结构。如对智力、人格等结构维度的认识,大都借助于因素分析方法。
(2)发展理论。因素分析可帮助研究者认识因素之间的关系,有利于理论的构建与发展。
(3)理论建构的验证。对已建立的各种理论进行实证性检验的一种有效的统计分析技术。
(4)有利于不同方法所测特质的比较。验证性因素分析方法可协助完成这一不同方法所测特质的比较。
(5)测验工具的核准。应用测验工具时,所测团体是否与测验初衷一致,是否存在偏差,可用验证性因素分析方法来计算。
13如何确定因素数目?
答:因素数目的确定方法如下:
(1)可解释性:是因素数目确定的重要前提。这要根据专业知识和理论的构想确定因素数目。
(2)方差贡献:一般以特征值≥1的原则选取公共因素的数目,同时还应考虑累积方差贡献率。
14聚类分析与因素分析的区别是什么?
答:(1)两种分析的目标和适用条件不同
聚类分析是将所观测的事物或观测事物的指标进行分类的一种多元统计方法。事先知道测试对象的类型,各种测试资料或每一测试对象的多项目观测数据,一般情况下这些数据是等距的测量数据。聚类分析要求被分类对象一次性完备,不允许中间插入新样品,否则要重复聚类分析的全过程。
因素分析是找主要因素的一种有力的工具。因素分析的基本思想是,首先将多个描述事物性质的变量综合为较少的几个“因素”,然后依据一定的方式对所获得的“因素”作出较为合理的解释。因素分析要求样本容量比较充足,要求数据具有中等至中高的变量内部相关,没有选择性偏差,线性等。
(2)两种分析的基本统计思路不同
聚类分析的统计思路:将分类对象置于一个多维空间中,按照它们空间关系的亲疏程度进行分类。依据的原则是同一类中的个体有较大的相似性,不同类的个体差别比较大。距离近的样品(或变量)应该归在一起,这里的“距离”指的是样品(或变量)之间的相似度。也就是说,相似度大的,可以归成一类。衡量两个变量的距离的方法是定义变量间的相似系数,相似系数最接近的两个变量相似性最大,可以归为一类。积差相关系数往往用来作为变量之间的相似系数。
因素分析的统计思路:将一系列变量归结为较少变量,以揭示其潜在结构,分为探索性和验证性因素分析。由于因素分析中相互之间存在联系的变量被浓缩为几个独立的因素,因此每个观测变量都可以由一组因素的线性组合来表示。因素分析的基本任务就是求因素负荷矩阵,据此决定各共同因素作用的大小及它们对每一变量作用的大小。为了使共同因素抽取后更有实际意义,对因素负荷矩阵进行旋转变换。
15探索性因素分析与验证性因素分析有何异同?
答:探索性因素分析与验证性因素分析是因素分析的两个不同的功能类型。
(1)二者的相同方面
探索性因素分析与验证性因素分析都是统计技术。二者都是从为数众多的观测变量中概括出少数不可观测的潜变量去替代已有的一些变量的统计分析方法。探索性因素分析与验证性因素分析是相关分析的进一步发展。
(2)二者的不同方面
①探索性因素分析是传统的因素分析方法。它是以观测变量为主,用一些新因素替代已存的观测变量;验证性因素分析是对已知因素结构的验证,因素结构是根据已有的理论事先加以确定的。验证性分析看重各因素对已知观测变量的因素负荷大小。因素负荷大的项目能够反映某因素的作用,因素负荷小的项目则不能反映某一因素。
②探索性因素分析的因素不确定,是以样本为中心,主要用于探索性研究;验证性因素分析要验证测验项目是否是所要测量的因素,目的是检验项目是否测量了某一理论,是以理论为中心的。
16如何选择统计分析方法?
答:要选择正确有效的统计分析方法,必须考虑两方面的问题:一是研究问题的性质、数据类型和特征以及研究设计,二是各种统计方法和公式的适用条件。
(1)选择统计分析方法应考虑的因素
①研究课题的性质和目的。对于描述性课题,研究者只想了解研究对象的特征或情况。一般可以采用平均数、中位数、众数等集中量数,标准差、偏离度、峰度、差异系数等离散量数以及相关系数等统计指标表示。对于推论性课题,研究者往往需要从局部的取样所获取的样本的性质来推测总体的性质,比较总体间有无差异,度量变量之间的关系以及预测类别等,一般采取的方法有参数估计、假设检验以及复杂的多元统计分析如回归分析、主成分分析、因素分析等。
②变量的特征。变量包括变量的数量和类型。变量的多少是统计分析中较重要的因素,确定变量数量的一般原则是用尽可能少的变量得出最佳结果。变量的类型有计数变量、顺序变量、等距变量和等比变量4种,与统计分析方法选择的关系分别如下:计数变量是指计算个数的变量,其数据一般取整数的形式,使用计数数据的统计方法,如百分比、列联相关、百分数检验方法和c2检验方法等;顺序变量既无相等单位,也无绝对零点,只表示研究对象在某一属性上的顺序,不能指出其间差别大小,统计分析常用中数、百分位数、等级相关、等级变异数分析、秩次检验等方法;等距变量有相等单位,但无绝对零点,对于等距变量可用平均数、标准差、积差相关、t检验、Z检验、F检验、方差分析等统计方法进行分析;等比变量既有相等单位又有绝对零点,等比变量适用的统计分析方法很多,除上述统计方法之外,还可用几何平均数及差异量数等进行分析。
③数据的分布特征。数据分布的形态很多,主要可分为正态和非正态(偏态)两种。在心理学研究统计分析中应用得较多的是正态分布。大部分参数统计方法的使用,都必须满足两个条件:总体分布呈正态和组间变异相等(方差齐性)。但非参数统计分析方法则不依赖于总体分布的条件,也无需对总体参数规定条件。
④研究设计类型。研究设计可分为被试内设计和被试间设计及混合设计等几种。在参数检验中,被试内设计的检验通常较被试间设计的检验有效。因为被试内设计中,每一被试区组都接受了所有的处理,因此减少了由于分组而造成的事先存在的系统误差。
(2)统计分析方法的适用条件
一般来说,每种具体的统计分析方法都有一定的适用范围和条件。例如,多元回归分析适用于说明一个连续的相关变量同若干独立变量间关系的广度、方向和强弱程度;方差分析适用于说明一个连续的相关变量和一个或多个称名独立变量间的关系;协方差分析用以说明一个连续相关变量和一个或多个称名独立变量间的关系,控制一个或多个连续独立变量的影响。