档案

Archive for 2009年4月

如何确定综合指数的构成权重?

2009/04/30 11 条评论

>

Anonymous @ 2009-04-29:

祝老师,您好!我现在在写硕士毕业论文,想请教您几个小问题。
我让主管给下属的三种绩效(任务绩效、情境绩效和反生产绩效)做出评分,然后对员工的总体绩效(与前面相独立的量表)做出评分,然后用三种绩效的得分对总体绩效得分进行回归,这样得出三个回归系数。前两个系数显著,后一个不显著。这三种绩效的系数可以视为主管在评价员工总体绩效时更看重哪种绩效,即一种权重。我想考查哪种绩效在总体绩效评分中更受主管重视,我还需要进行两个系数的显著性差异的检验吗?如果要,如何做?

Anonymous @ 2009-04-29(也许是另一读者):

他的意思应该是这样说,已经有若干个观测变量,这些变量为了测量隐含变量(总体满意度)。但由于理论上不同的观测变量对总体变量的影响程度是不一样的,对隐含变量的贡献程度不一样,系数也就不一样,不能通过全体简单的平均得出结果。那么,得通过什么方法来确定每个观测量的权重,再配合每个观测变量的均值来求得最终的隐含变量呢?结构方程中的路径系数是否可以作为这个权重来理解呢?

我也想顺便问一下,相关系数R平方是否也可以作为权重?回归系数呢?有的文章是通过因子分析,用共同度来作为对总体的权重系数,这个处理方法合理吗?

庄主 @ 2009-05-02:

上述两个问题应该是不同的。匿名一(大家提问时能否留个名?当然假名虚名浪名都可以,以便区分)的问题是一组supervised数据,即总体绩效是一个观测到的变量,而匿名二的问题中因为总体绩效是没有观测的隐含因子、所以是一组unsupervised数据。两者之间当然后者更常见,但前者含有更多信息、因此可以研究更多问题。

一、先讨论匿名一的问题。他(她?)的模型应该是(见最后的注释)

Y = b0 + b1y1 + b2y2 + b3y3 + e                        (公式一)

用来检验y1 – y3各自对Y的影响(即其所说的“考查哪种绩效在总体绩效评分中更受主管重视”)。是否需要对b1与b2、b1与b3、b2-b3三对系数之间的差别做显著检验?当然要。如何做?请参见前贴“如何检验两个回归系数的差别?”。

二、匿名二提出的是一个含三个观测变量的测量模型(measurement model),即

y = Λyη + ε                                                       (公式二)

其中y = y1,y2,y3,η是隐含因子、Λy 是η对各y的影响(也即权重),ε是各y中不受η影响的独自变异(也即误差)。显然,公式一与公式二很不一样:总体绩效在公式一中是因变量(等号的左边)而在公式二中是自变量(等号的右边);公式一中的b1 – b3无论在理论上还是在数值上都与公式二中的Λ1 – Λ3是不同的。

三、现在分别讨论匿名二提到的四种确定y之权重的方法:

1、结构方程中的路径系数:英文为path coefficients of the structural model,但本案没有path coefficients、只有factor loadings of the measurement model(测量模型的因子负荷,即公式二的Λ1 – Λ3)。答案是肯定的,因子负荷就是被当做y1 – y3的权重的。

2、相关系数R平方:不清楚你指的是y1 – y3之间的两两相关系数之平方,还是公式二的R平方?前者与匿名一的研究问题无直接关系。后者就是Λ1 – Λ3的平方。

3、回归系数:同样不清楚你指哪个“回归模型”?如是公式一,你没有直接观测的Y,无法估计。如是公式二,就与你的方法1相同。

4、因子分析的共同度(commonality):这里指的应该是exploratory factor analysis,既然现在有理论导向的confirmatory factor analysis(即公式二),就不必再用数据导向的EFA了。

四、有心的读者也许会想到将匿名一的supervsied数据和匿名二的unsupervised数据(两者中的y1 – y3是相同的)合在一起考虑,就是说,先用公式二构建隐含因子η,然后再检验其与观测变量Y之间的相关关系。一般说来,η与Y是正相关的,但其相关程度不一定是很强烈的、甚至不一定是显著的(如果样本小的话)。其背后有两种可能性:一是方法上的问题:虽然η没有测量误差、但Y含有一定的测量误差(但无法估计),二是理论上的问题:η与Y不一定是一个概念(如η也许是一个多维的因子,其中某些维度与Y无关),即confirmatory validaity问题。如果数据中只有Y和y1 – y3四个变量,我们无法将这两种原因分开。如果有其它“第三者”变量(在理论上与Y或测量误差有关),则可以进一步解析下去(重大突破往往就在眼前了)。但是,即使只有这四个变量,据此而发现的η与Y的相关关系,已经提供了很多信息(如对η效度的独立验证)。

最后,讲一讲语言的精确性问题(应该是已讲过多次的老话了)。匿名一说“用三种绩效的得分对总体绩效得分进行回归”,这句话大概是说倒了的,而本意应该是“用总体绩效得分对三种绩效的得分进行回归”(即公式一)。而匿名二的本意才是“用三种绩效的得分对虚拟的总体绩效得分进行回归”(公式二),但他(她)提到的方法3又和公式一混起来了。思想的迷惑往往与语言的含混互为因果。如何避免?用公式和英文。在英文里描述回归模型的句型是

regress Y on X controlling for Z,或者Y is regressed on X with Z controlled

其中Y、X和Z分别指因变量、自变量和控制变量。这使我联想起前几天与一些学生聊天的情景,当时我建议他们学研究方法时不要看中文书,因为中文语言不够严密,不料遭到强烈质疑,要我举例证明。这里是又一例。如果依靠他们的中文描述,很难将匿名一和匿名二之区别弄清楚的。

分类:统计 标签:, ,

如何检验两个中介变量的效应?

2009/04/24 留下评论

>

flyingzjt @ 2009-04-21:

经常看贴,收益良好,今天请教一个问题:X影响Y的关系中有两个中介变量A,B,如果A与B相关,那么其中介效应如何确定,其大小可以比较吗?如果有两个自变量X,Z,中介变量仍为A,B,可能的影响为X-A-Y,同时Z-B-Y,且A与B相关,X与Z相关,那么两个中介变量的效应又如何确定,如果上述变量均为潜变量,如何用LISREL与AMOS检验中介效应?多谢多谢!

庄主 @ 2009-04-25:

你的问题叙述出来好像挺复杂,但如果先画个图(见下图b)再来看,就属常见并较简单的模型之一了。(注意,为了与我在“八大矩阵”中用的符号一致,我用γ表示从X和Z出来的影响而用β表示从A和B出来的影响;其它的系数如φ、ψ、ξ等也来自“八大矩阵”。)

image image

 

 

 

 

 

 

我估计你已经知道,中介效应需要满足以下条件:

  1. 在中介变量(A或B)没有起作用之前(如图a),自变量(X或Z)对因变量(Y)有显著的direct effects(直接影响,即βYX或βYZ ≠ 0);
  2. 当A或B出现之后(图b),X或Z通过A或B而对Y有显著的indirect effects(间接影响,即γAX或γBZ ≠ 0以及βYA或βYB ≠ 0);
  3. X或Z对Y的间接影响大于其直接影响(即γAX × βYA > γYX 或γBZ × βYB > γYZ );
  4. 当A或B起作用之后,X或Z对Y的直接影响随之彻底消失(即γYX或γYZ = 0,这就是为什么我在图b中用虚线表示相关的线条),

注:如果只满足条件1-3,则可认为存在weak version (弱版本)的中介效应;而如果条件1-4均被满足,得到的则是strong version(强版本)的中介效应。

根据上述条件,我们可以很容易地在SEM中检验中介效应。在本例中,由于涉及两个中介变量,可以分以下几步做:

  1. 检验“直接影响”模型(图a),如果其中的γYX 或γYZ 为显著,则条件1成立;
  2. 加入A和B而构成一个full model(“全模型”,图b),如果其中的γAX 和βYA同时显著、或γBZ 和βYB同时显著,则说明条件2成立;
  3. 如果全模型中的γAX × βYA > γYX 或γBZ × βYB > γYZ (前者即LISREL、AMOS等软件中报告的X或Z的间接影响值、而后者则是报告的X或Z的直接影响值),如果两者有显著差别,则说明条件3成立;
  4. 如果全模型中的γYX 或 γYZ 不显著,则说明条件4成立。
分类:统计 标签:, ,

如何检验时间序列数据中的自相关?

2009/04/19 留下评论

>

happyle @ 2009-02-22:

关于一元线性回归的问题
用一次考试的成绩预测另一次考试成绩,建立回归方程。。。显著性检验。。。
F检验、T检验都有统计学意义
回归标准化残差直方图正态分布
P-P图正态分布
因变量与回归标准化预测值散点图呈直线趋势。。。
但是。。。
D.W.=.815
这表明残差之间正相关,不是相互独立的
所以请问下,这时候考虑DW值是否有意义?

庄主 @ 2009-04-18:

首先要抱歉没有及时回复你的问题。我写帖子的时间不多,每次从收到的问题中按我对读者的兴趣判断挑一个。你的问题有一定的技术含量、但比不上近期的其它题目更有普遍兴趣。

其次提个建议:以后能否将你的问题用sentences(句子)而不是bullet points(词汇排列)表达出来?不知是否受到PPT讲义的影响,越来越多的学生提问时采用这种方法。虽然简要,但如果简略到意义残缺,就适得其反了。准确地描述问题,是学好定量分析的基本功之一。

好了,回到你的问题。先为其他读者介绍一下背景:DW(Durbin-Watson)值是检验一组时间序列数据中自相关(autocorrelation) 程度的统计量。更准确地说,DW检验的是零假设为:一个为时间序列的因变量Yt在对若干(1至k个)自变量作回归之后的每个时间点的residual(残差,记为et)与其前一时间点的残差(et-1)之间的相关(记为 Cor(et, et-1))= 0。这种自相关,也被称为 first-order autocorrelation,简称AR1,中译“一阶自相关”,这里的所谓“一阶”是指两个残差之间相差一个时间点。

这里涉及好几个概念和问题:什么是残差(比较容易理解),什么是自相关(有点难度),一阶与高价自相关有什么差别(也有点难),自相关不等于0会有什么问题?等等。我只谈最后一个问题,因为与你问题直接有关,而其它留待以后有机会再谈。

简单说来,如果 Cor(et, et-1) = 0, 那就违反了OLS回归的基本要求之一(即残差之间的独立性)。如果残差之间有自相关,虽然不会影响回归系数的值,但会影响(低估)回归系数的标准误差(即自变量对因变量的显著程度,从而犯了Type I错误)。这是少数不可饶恕的“死罪”之一,而DW值就是判断是否犯了此罪的判决书。

DW值与Pearson r或其它相关系数不同,其取值在0至4之间,其中当DW值=2时,说明自相关=0;如果DW(明显)小于2,反映有正的自相关(positive AR);如果DW(明显)大于2,反映有负的自相关(negative AR)。两者相比,前者(正相关)更为常见。这里又出现一些新的概念和问题,如什么是正的自相关、什么是负的自相关、怎样才算明显小于或大于2,等等。这里只谈最后一个问题,即DW对2的偏离到达什么程度,就是“明显”或“显著”差别了。

与其它许多统计检验的做法(一般是将统计值除以其标准误差)不同,DW的统计检验比较复杂和繁琐。Durbin与Watson编制了一套检验表,分别对应于不同的数据时间点、不同的自变量个数和不同的显著水平(分为0.01和0.05两种),提供两个临界值,分别记为DL(下限,低于其者则绝对有自相关)和DU(上限,低于其者“也许”有自相关)。具体使用如下:

image

  1. 观察到的DW值小于2(即正自相关)时:
    1. 如果DW大于DU,说明总体中的Cor(et, et-1) = 0,即可以接受回归分析结果;
    2. 如果 DW小于DL,说明总体中的Cor(et, et-1) ≠ 0,即不能接受回归分析结果(因为自变量与残差之独立性被破坏而使得回归结果不可靠);
    3. 如果DW落在DL和DU之间,则是一个灰色地带,需要进一步根据你的自变量分布是否均匀(即X在自己的各个取值上是否平均分配)来决定。如是,则按1b办;如否,则按1a办。
  2. 观察到的DW值大于2(即负自相关)时:
    1. 如果DW小于4-DU,则如同1a,即总体中的Cor(et, et-1) = 0而可以接受回归分析结果;
    2. 如果DW大于4-DL,则如同1b,即总体中的Cor(et, et-1) ≠ 0而需要拒绝回归分析结果;
    3. 如果DW落在4-DL和4-DU之间,则如同1c,是一个灰色地带,需要进一步根据你的自变量分布是否均匀而决定是参照2a还是2b。

上图是我从DW表中选出的三组临界值,其显著水平均为p = 0.05,时间点在10至100个之间,自变量个数分别为2、4和6个。从图中可以看出如下规律:一、当时间点小于20而自变量为4个以上,DU接近甚至大于2(即数据一定有自相关),而且DL与DU之间存在巨大的灰色地带;二、随着时间点增加至30以上,DU变得相当稳定,而DL与DU之间的灰色地带逐渐缩小;三、DL与DU之间的差距并不是对称的。这些都有助于我们理解时间序列分析的基本要求(如数据时间点至少要30个以上、自变量个数不能多)的来源,同时也说明一些“常规说法”(如DW值不能小于1.0)其实并不准确。

你做的是一元回归方程,说明有1个自变量,得到的DW值为0.815,显示存在正的自相关。你没有交代数据的时间点,但可以从上图的红线中看出,你的DW值一定是低于临界点下限的。

你问:这时候考虑DW值是否有意义?当然有意义:你数据中有显著的自相关。我猜你的原意是“这时候回归分析结果(如回归系数达到显著水平)是否还可靠?”前面提到,在显著的自相关下,回归系数的标准误差被人为缩小而显著水平被人为提高,所以也是不可靠的。

当然,你的数据也许不是时间序列 (Yt = b0 + b1Xt) 而是panel数据 (Yit = b0 + b1Xit) ,因为你说用“考试成绩2预测考试成绩1”,暗示该数据中只有两个时间点,但应该有i个人。如果是这种i x t的数据(注意panel公式中的下标),不能用上述经典的DW检验,而应改用修正过的DW公式。SAS、Stata等软件中有,但SPSS13版(我不知14版以后的情况)并不提供这一统计量。

分类:统计 标签:,

共同影响与交互影响是一回事吗?

2009/04/13 留下评论

>

LH @ 2009-04-03:

我看了你最近的博客如何处理和报告含高度相关自变量的回归分析?,有一个疑问,如下:

Y = b0 + b1A + b2B + b3AB + e                   (公式六)

得到R62。这个跟R12是什么关系呢?R62不应该是包含了A的贡献,B的贡献和AB交互贡献的总的公式吗?

假如我的研究问题是想搞清楚AB的共同影响,您的原文中说“Δ3 = R12– R42 – R52”,“Δ3反映了A和B的共同影响”,那么R62– R42 – R52又是什么呢?

我是不是搞混了“交互作用”和“共同影响”?

b3AB中的b3是“交互作用”,而Δ3是共同影响?

或者这两个词是一回事,我在别的地方弄错了。

您看这样的理解对不对:对b3AB中的b3关注的是AB交互对回归系数的影响(放大或者缩小),而对Δ3的关注是关注AB对回归方程effect size的影响。而对Δ3研究effect size影响的时候,应该采用公式一Y = b0 + b1A + b2B + e ,而非公式六?

但愿我没有越说越糊涂。

庄主 @ 2009-04-12:

一、公式1与公式6之区别:原文公式1(Y = b0 + b1A + b2B + e )只含A和B的main effects(主影响),而公式6加入了A X B的interactions(交互影响)。所以,前者是“主影响模型”而后者是“交互影响模型”。显然,这两者是nested,即前者是后者在b3(即交互影响)=0时的一个特例。所以,我们是通过(R62– R12)/R62来检验交互项是否显著的。

二、R62– R42 – R52又是什么呢:公式4和公式5都是公式1的一个特例。公式4(Y = b0 + b2B + e)是公式1在A的net effects(独立影响)=0时的特例而公式5(Y = b0 + b1A + e)在B的独立影响=0时的特例。因此,两者也是公式6的一个特例。R62– R42 – R5= 交互影响 + A和B共同影响。

三、交互影响与共同影响之区别:两者是完全独立的两个概念,不要搞混了。(当然,你即不是世上第一个、也绝不会是最后一个混淆两者的人。)由于经常与人辩论这个问题,我最后找到一个简单而又有力的例子:含A和B两个自变量的factorial experiment正交实验),在此条件下,A和B是完全无关的(为什么?考考你),即两者对因变量只有独立影响而无共同影响(即 Δ3= 0);然而,分析正交实验数据时,我们一定要检验A和B之间的交互影响,结果有时显著、有时不显著,这就不说明交互影响与共同影响是无关的两回事吗?(我好像写过一个类似的帖子,但一下子查不到了。知道的读者帮帮忙吧)

四、共同影响是什么东东:我写过N个帖子讲交互影响,你的上述理解是对的。这里讲几句什么是共同影响。首先,这个名词容易误导。英文中不是“common effects”,而是confounding effects, overlapped effects, shared effects(干扰、重合、共享等等)。它并不是什么好东西,甚至连“东西”都不是,因为它不含任何信息,只是一个即属于A也属于B的混沌世界(但真正的混沌是有信息、可以解的),也许称为“灰色地带”更准确(相信很多读者对在政策灰色地带中生活有深切感觉)。

当然,“灰色地带”有多种来源,如A和B缺乏discriminant validity(差异效度)、A和B受到第三者变量的影响下、A和/或B中含有偏向对方的系统性误差,等等。不管来源为何,其直接影响了模型的理论解释力(当然并不影响模型的预测能力),所以一般是想方设法减小(而不是“研究”)AB之间的“共同影响”。

你的最后一段文字,大意对、但表述不准确。如果按我上述说法,应该如何改一下呢?

附录:

为了演示“交互影响与共同影响是完全独立的两个概念”,我用SPSS设计了一个正交实验的模拟数据,样本N=400,A和B完全独立、而且A、B与其交互项AB也完全独立,同时A、B、AB分别解释了Y的三分之一变差(当然只有在模拟的理想世界中才可能发生)。你运行一下,查看输出的相关矩阵和回归结果来验证一下。最后,如果你琢磨一下crosstabs的结果,应该可以找到我上面有关为何正交实验的自变量之间是完全独立的原因。

set seed=123.
input program.
loop #i=1 to 400.
compute ID=#i.
end case.
end loop.
end file.
end input program.
do if ID<=100.
compute A=-.5.
compute B=-.5.
else if ID>100 and ID<=200.
compute A=-.5.
compute B=.5.
else if ID>200 and ID<=300.
compute A=.5.
compute B=-.5.
else if ID>300.
compute A=.5.
compute B=.5.
end if.
cross A by B.
compute AB=A*B.
compute Y=AB*.5+A*.25+B*.25.

cor A B AB.

*Model 1 (R-square=.667).
reg dep=Y/enter A B.

*Model 4 (R-square=.333).
reg dep=Y/enter B.

*Model 5 (R-square=.333).
reg dep=Y/enter A.

*Model 6 (R-square=1.000).
reg dep=Y/enter A B AB.

分类:统计 标签:,

如何做“有序Logistic回归”?

2009/04/11 留下评论

>

patricia @ 2009-04-12:

祝老师, 你好, 我想问个关于回归的问题. 对照组病灶数0, 病例组病灶数为1,2,3. 现在想了解几个危险因素和病灶数的关系, 是不是应该用有序logistic回归来分析. 能不能概括一下步骤, 看了一些资料, 还是感觉茫然! 谢谢!

庄主 @ 2009-04-12:

我对医学知之甚少,不知取值从0到3的“病灶”应该是一个定距 interval) 还是一个定序 ordinal) 的变量?既然你已考虑用有序logistic回归(ordinal logistic regression,以下简称OLR),说明你是确定病灶为定序变量的。

logistic regression(LR)用于分析因变量为定类或定序的数据。其中分为三个分支:一是因变量为二分组的binary LR(通常在LR一词之前不注明binary),二是因变量为多项分组的multinomial logistic regression(MLR),三是这里谈的OLR。显然,MLR和OLR相似,唯一的区别是前者因变量各组之间只有性质的区别而后者各组之间有大小之别。

我用过MLR,但没有用过OLR(所以以下部分纯属“知识”而不是经验之谈),刚才查看了一下SPSS中的OLR程序(SPSS中叫做PLUM,但不是可口的李子噢),觉得它的操作及输出结果与MLR大致相仿(其实前者比后者更简单,这也许是好事),主要要多了一项“Test of parallel items”的输出,用于检验因变量各组之间的预测值(即根据自变量而模拟的logistic曲线)是否平行。

你希望了解一下操作步骤,我觉得你既然知道选择OLR,操作对你来说应该没有任何困难。如在SPSS里,将定类的自变量当作Factor、定距的自变量当作Covariate,如果需要检验自变量之间的交互影响,在Location中指定。以下是基本的Syntax(假定有两个定类自变量x1、x2和一个定距自变量z,其中x1和x2、x1和z被假设有交互关系):

PLUM y BY x1 x2 WITH z/LOCATION=x1 x2 z x1*x2 x1*z/PRINT=FIT PARAMETER SUMMARY TPARALLEL.

其中PRINT=TPARALLEL就是检验y各组预测值的平行性(注:如果不平行,并不是说明它们之间有交互影响)。

我猜你参阅了其它资料后的困惑,主要在于对其输出结果的解读上。这是在对定类因变量做多元分析时使用各种LR或者Loglinear时普遍出现的问题。(曾有一位学生问我,是否需要选修一门专讲Loglinear Analysis的课,我强烈推荐,说哪怕你以后从不用Loglinear,懂得如何解读定类因变量的多元分析结果就终身受用了。)这种困惑,与你已有如何处理定类变量的其它经验直接有关(注意,我不用知识,因为一般知识在这里帮不了你)。如果你会在各种回归中设置和解读定类自变量,就应该会将其原理推广到如何设置和解读BLR中定类因变量、并进一步推广到如何设置和解读MLR中的定类因变量或OLR中的定序因变量了。我在本庄已写过多个有关如何设置和解读定类自变量的帖子,请查询一下。如果你读后还是觉得无从下手,说明你还只获得了一下(简单)知识,需要从那里开始动手做,以积累必要的经验,然后循序渐进、最后才来做OLR,定量分析很难一步到位的。

分类:统计 标签:,

分样本比总样本的回归分析更准确吗?

2009/04/11 留下评论

>

罗拉@2009-03-30:

祝老师,1.这个问题是上次“如何检验男女两组回归系数之间的差别?”的延续,性别是调节变量,影响了自变量和因变量关系的方向,生成性别和其他两个变量的交互项进行统计解释率为21%,但是分性别统计时,女生为20%,男生为33%,这时是不是分性别统计更准确呢?

2.自变量为两个分类变量(性别,年级),因变量为二分变量(稳定,不稳定),我现在用RC表统计的,但是如果要考虑性别和年级在因变量上的交互效应该如何做呢?

庄主@2009-04-11:

先叙述一下罗拉的问题1:他/她想检验的模型为

Yi = b0 + b1X1i + b2X2i + b3Zi + b4X1iZi + b5X2iZi (公式1,i = 1 ~ N)

其中Y是因变量、X1和X2是自变量、Z是作为调节变量的性别,用于某一样本(记为N),其回归方程的R平方(记为R21)为0.21。如果将样本N按男女分成两个分样本(N1和N2),分别用以下模型做回归

Yi= b0 + b1X1i + b2X2i (公式2, i = 1 ~ N1)

Yi= b0 + b1X1i + b2X2i (公式3, i = 1 ~ N2)

(注意:性别Z在两个子样本中都是一个常数,即在男性中=1、女性中=0,所以公式2中没有b3Z、b4X1Z和 b5X2Z三项。)其R平方(分别记为R22和R23)分别为0.20和0.33,前者略小于R21、但后者则明显大于R21

(罗拉及其他网友:如果下次你有疑问,能否将问题按类似的详尽程度叙述出来?这次我完全看懂罗拉的问题、但担心有些读者看不懂,所以详细写出来;但有时我也不大或完全看不懂问题。)

罗拉的结论“分性别统计更准确”涉及几个误解。第一,就R2而言,R22和R23合在一起与R21是等值的,这是因为R21是R22和R23加权平均数(weighted mean)。本例中R21非常接近女性组的R23而遥遥远离男性组的R22,这应该是女性人数明显多于男性人数而造成的。

注意:上述公式1和公式2+公式3是等值的;但是如果在公式1中拿掉与Z有关的b3-b5三项,即

Yi = b0 + b1X1i + b2X2i (公式4, i = 1 ~ N)

公式4与公式2+公式3是不等值的。公式1是一个含交互项变量的模型。公式2+公式3是公式1的分拆,所以是一组隐含交互项的模型。而公式4只含主影响,R24会小于R21或R22和R23的加权均值。大家不要将公式1与公式4混淆了。

第二、虽然分样本的R22和R23与总样本的R21等值,但是由于分样本的个案数(N1和N2)小于总样本数,所以总样本的回归结果要比两个分样本的结果更精确(即样本大则误差小)。

第三、虽然对两个分样本的b0、b1或b2作比较很直观,但是这种比较并不能告诉我们两者之间是否存在显著差别,而总样本(即公式1)中的b4和b5分别直接检验了Z与X1及Z与X2的交互影响(详细参见如何检验男女两组回归系数之间的差别?)。

罗拉的问题2,与问题1的唯一区别是因变量是dummy变量,自然不能用经典的OLS回归而应该用Logistic Regression等工具。但是对两个自变量(其实是一个自变量和一个调节变量)之间的交互影响的检验和展示,与问题1以及本庄有关交互影响的三、五个帖子完全一样,恕不赘言。

如何绘制调节效应的图形?

2009/04/11 留下评论

>

无名氏 @ 2009-04-09:

我是一名应届毕业生,人力资源管理专业,目前在做关于调节作用的毕业论文。向您请教一个问题,“如何绘制调节效应的图形”?谢谢您,祝开心!

庄主 @ 2009-04-10:

这个问题,其实就是如何用图形表示交互关系。而最常见的图形则是直线图(line chart,相信你多半见过),其中Y轴是因变量、X是自变量、图中至少有两条线,每条线代表调节变量(moderator variable)的一个组(更精确地说,是X与Y在该组数据中的关系)。这种图很容易画,可能的难点在于如何设定每条线的斜率,解决方法是先解析出每条线所对应的回归方程,余下的步骤就是小菜一碟了。以下举几个例子来说明。

一、调节变量是一个二分的定类变量(dichotomized nominal variable):

image

假定你的回归方程是 Y = b0 + b1X + b2Z + b3XZ,其中Z是调节变量、含有两个组别(如男女,分别取值1和0,当然也可取1和2或其它数值,但如下述,取1和0会简化结果的解读和制图)。再假定你的回归结果是b0 = 9.7, b1 = 0.3, b2 = 9.7, b3 = -9.1(这里的系数都是为了制图方便而编出来的),那么,男女两组的方程分布是 Y = 19.4 + 0.6X 和 Y = 9.7 + 0.3X(具体过程略过,但你应该逐步演算一遍,以确保理解男女分组方程的来历以及各自与总方程的异同、如女性组方程的b0和b1与总方程的b0和b1相同,女性b0与男性b0之间的差别就是总方程的b2,女性b1与男性b1之间的差别就是总方程的b3,等等)。有了这两个方程,就可以分别算出男女两组在X的最大和最小值时Y的预测值(这一步可以搬到Excel里做,比SPSS方便)。假定X在1-100之间变化,那么当X=1时,男性的Y = 19.4 + 0.6 x 1 = 20、女性的Y = 9.7 + 0.3 x 1 = 10;而当X=100时,男性的Y = 19.4 + 0.6 x 100 = 80、女性的Y = 9.7 + 0.3 x 100 = 40。根据这四组数据(1、20;100、80;1、10;100、40),就可以画出图1了。

二、调节变量是一个三分的定类变量(trichotomized nominal variable):

如果调节变量Z是一个含三个组的定类变量(或含三个层次的定序变量、但被当作定类变量处理;如果你想将其当作定距变量处理,见下例),需要先为Z构建两个取值分别为1和0的二分变量(见上例),分别记为Z1和Z2,而回归方程则为Y = b0 + b1X + b2Z1 + b3Z2 +b4XZ1 + b5XZ2。假定Z是职业,Z1是白领 = 1、其他 = 0;Z2是退休 = 1、其它 = 0;蓝领是基准组、在Z1和Z2上都取0。为了省事,我将图1中的男性数据改为白领、女性数据改为蓝领、只增加退休组的数据。而回归结果为 b0 = 9.7, b1 = 0.3, b2 = 9.7, b3 = 50.7, b4 = -9.1, b5 = -51.1。如上例一样,现在可以根据b1-b5的系数以及Z1和Z2的取值,求出三个职业组各自的方程:

image白领组(即Z1 = 1、Z2 = 0):Y = 19.4 + 0.6X

蓝领组(即Z1 = 0、Z2 = 0):Y = 9.7 + 0.3X

退休组(即Z0 = 1、Z2 = 1):Y = 60.4 -0.4X

最后用画图1的方法画出图2(具体步骤略过,但希望你自己演绎一遍)。其中前两组与图1相同(因为我就是用同一批数据构建的),而退休组因含有一个负值的b1所以呈现向下的趋势。

三、调节变量是一个定距变量:

定距变量往往有很多个值,不可能也不必要对每个值画一条线,一般是取两、三个“代表性”(representative或illustrative)的值各画一条线。如果是取两个值,一般取Z的平均数的正负一个标准差的值(即Z值上第16%位和第84%位的值);如果取三个值,则将平均数作为第三个值。假定这里的Z是年龄,其平均值 = 40,标准差 = 20,而回归系数b0 = 20, b1 = -0.067, b2 = 0.50, b3 = 0.008,我们取Z的均值(40)、大于均值一个标准差(60)和小于均值一个标准差(20),分别得到以下三个方程:

image60岁老年:Y = 50 + 0.39X

40岁中年:Y = 40 + 0.24X

20岁青年:Y = 30 + 0.08X

然后用与图1和图2相同的方法画出图3(具体略过)。

四、其它各种可能性:

如果Z是一个中心化(centralized,见)的值(这时,X也应该是一个中心化的值),那么需要在解析出上述公式后,再将Z(和X)的值减去其平均值而得到其“原始值”,并在图形中以原始值来设定X轴和Z的斜率。

如果有两个或更多的调节变量,分组方程的解析并不困难、但画图就有点复杂了,一般是用k个图来表示,其中k等于其中一个调节变量的组别数。假定一个调节变量是性别、另一个是年龄。可以用两个图来分别显示:一是 男性中年龄、二是自变量X的交互效应和女性中年龄与自变量X的交互效应。或者用三个图来分别显示年龄与自变量X在老年、中年和青年中的交互效应。究竟用性别还是用年龄作为第一层的分组指标(其实也就是调节变量的调节变量),取决于你的研究假设:你最终想比较的是什么?

最后,如果你用的是方差分析,上述原则同样全部适用。其实SPSS方差分析也可以产生回归系数的。