留言版

留下评论 Go to comments

隐私声明：一、本站旨在推进知识分享，欢迎提问和答疑。二、访客在此提供的问题或答案，均被认为不含个人隐私、学术或商业机密。三、如通过email发给庄主的问题或答案，如有不宜公布的隐私或机密内容，请注明。否则将认为可以公开。

礼仪声明：一、本站提倡对话、讨论和磋商。二、欢迎不同意见、希望就事论是、反对人身攻击。三、如有与上述精神不合之评论，将部分删节或全部删除。

提问方式：大家可在下面提问和建议；如涉及某一特定贴子，请去该贴中发言。由于各学科的传统、术语、符号等各不相同，请提问时交代一下你的学科，以帮助我理解问题的来龙去脉。

评论 (25) Trackbacks (0) 留下评论 Trackback

shawllakyo

2011/06/09 7:10 上午

回复

庄主，我最近遇到一个问题，希望您能帮我解答下

简述一下我的问题 DV：简称SR IV：简称BL 调节变量有5个，分别为五个性格， A,C,E,N,O 我的假设是人是可以具备多重性格的，例如同时属于A C类型的人。

我应该分别进行调节的测试分为5个PANEL
还是可以一起测试 BL= b0+b1*SR+b2*A+b3*(SR*A)+b4*C+b5(SR*C)+ b6*E+b7*(SR*E)…

前者与后者有什么不同，问题基础，望见谅
- 庄主
  
  2011/06/14 8:37 下午
  
  回复
  
  Shawllakyo: 请你先澄清一下：你的自变量和因变量是否写反了？在你的公式中，BL出现在等号左边，那是因变量，而SR出现在等号右边，那是自变量。
  - Shawllakyo
    
    2011/06/27 6:30 上午
    
    是写反了，不好意思，我又发了一个比较具体的留言在板上
  - Shawllakyo
    
    2011/06/27 6:50 上午
    
    不好意思，我怎么看不见自己发的评论了
Shawllakyo

2011/06/27 6:51 上午

回复

我复制给您好了

您好！
我的论文中出现一个问题
因变量是顾客忠诚（BL），自变量为补救感知（PJ）都是5度量表，我设计的调节变量有两个（A）（C）分别是亲切度与敬业度，分高低组。在之前的研究中，我证明了，高A比低A组更容易因为接受好的补救而忠诚（e.g. HA：斜率0.7;LA：斜率0.5）；相反高C比低C组更不容易因为接受好的补救而忠诚（e.g. HC：斜率0.2;LA：斜率0.6)
这个答案让我有兴趣去研究A，C 共存时的交互
我现用的方法是类似交叉的检验，即
在A=1（高A组）中，看C的调节作用
在A=0中，看C的调节作用
在C=1中，看A的调节作用
在C=0中，看A的调节作用
其中，第1，2，3个都明显，第4个不明显

Q1：不知道这样的方法对不对？

如果我想用双DUMMY的方法检验，不知道如何设交互项
是不是可以这样
BL=B1*PJ+B2*A+B3*C+B4(PJ*A)+B5(PJ*C)+B6(A*C)+X0
(A=0,C=0)组：BL=B1*PJ+B0
(A=1,C=0)组：BL=(B1+B4)*PJ+(B0+B2)
(A=0,C=1)组：BL=(B1+B5)*PJ+(B0+B3)
(A=1,C=1)组：BL=(B1+B4+B5)*PJ+(B0+P2+B3+B6)
不知道这样对不对？BLOCK的方法有应该如何侧，谢谢您帮我看看
sober

2011/06/30 6:49 下午

回复

庄主好，本人学心理学出身，现在转到社会学，心理学中等级相关见到的比较少，所以对此没有深究。现在有困惑所以求教高人。
1 年级、文化程度等变量是类别变量还是顺序变量？
2 文化程度与收入水平（高中低三级或更多级别）的相关是用卡方检验还是用等级相关做？
3 等级相关对于等级数目是否有要求？例如，必须10等级以上或5等级以上（看到过这个说法，不确定是否正确）
希望高人指教。
zengfanbin

2011/07/02 7:06 下午

回复

祝老师，我用一量表测量了12项互联网使用方式，进行因子分析，得出4个因子，那接下来我是将这四个因子分别用SPSS产生4个因子得分新变量factor1–factor4，还是将4个因子对应的12项不同的项分别简单加总得出一总数或平均数，请问这两组生成的变量会对回归结果产生不同的结果么？如果我采用SPSS产生4个因子得分新变量factor1–factor4这种方法，因为这4个因子得分都标准化了，进入回归模型的时候其他变量也要标准化吗？不标准化会影响结果吗？谢谢！—-暨南大学曾凡斌
keykure

2011/07/30 11:05 上午

回复

庄主，您好，我最近碰到一个问题，跟下面这个帖子的问题很像，但是没有这么复杂。http://zjz06.blogspot.com/2010/03/blog-post.html

我的问题描述如下：
考察自变量X，因变量Y之间的相关关系。
但是这两者XY都受到两个因素Age和Sex的影响，因此给怎么建立模型来控制Age和Sex的影响。具体我该采用什么方法（比如GLM）来进行统计分析呢？
丫丫

2011/08/12 1:08 上午

回复

您之前写的调节效应的检验方法文章，和最近写的‘变量的标准化与中心化有何不同’文，都主张将变量中心化之后再看交互效应。但我最近看到一篇文章Brambor, Clark and Golder,Understanding interaction models: improving empirical analyses,p17页提到’centering doesnot change the statistical certainty of the estimated effects and, therefore, cannot really mitigate any multicollinearity issues that exist’。此前有个学者，我们交流的时候，他说他一直都是直接相乘的，没有先经过中心化处理。

我就迷惑了。有几个问题想向您请教和再确认：

1.做调节效应，是先放X,M，再放(X-x均值)*(M-M均值)，还是先放X,M，再放X*M？

2.为什么做x-y的u型关系的时候，是先放x，再放x平方，并没有中心化，而可以想象x和x的平方高度相关，这个怎么解释？

3. three-way interaction应该怎么检验？第一步放x1,x2,x3,第二步放x1x2,x1x3,x2x3，第三步放x1x2x3。我想知道这里的两两相乘和三个相乘，是直接的相乘，还是中心化过了的相乘？如果第二步是中心化过了的，那在第三步中心化之后相乘，依然与第二步放入的变量有高度的相关啊。请指导three-way interaction具体应该怎么做。

打扰。谢谢了。
ajun685

2011/08/17 1:52 上午

回复

老师，您好！
我是一名会计学学生，最近在做论文时在对交互项的解释时遇到了一些困扰，查看您解释交互项影响的帖子也没能找到答案。在此，把我的问题简述如下，万望您能给与解答：
想考虑：x1对y的影响，以及x2对“x1对y影响”的影响。
模型1：y=b0+b1*x1+b2*x2，回归结果：b1显著为正
模型2：y=b0+b1*x1+b2*x2+b3*x1*x2，回归结果：b1显著为“负”！，b3显著为正。加交互项后b1的系数与不加交互项时相反。
此时怎么解释交互项的系数呢？我和同学讨论时，有两种观点：
1、模型1中x1对y有正的影响，模型2中交互项系数也显著为正。说明x2“增强”了“x1对y的影响”。
2、认为两个模型不能混杂来看，解释交互项只能看模型2本身的回归结果，和模型1无关。b1显著为负，交互项系数b3与b1反向，说明x2“减弱”了“x1对y的影响（负影响）”
不知这两个观点哪一种正确？
- 庄主
  
  2011/08/17 6:08 下午
  
  回复
  
  ajun685:
  
  b1在main effects模型中为正而加入交互关系后为负是常见的现象，原因在于x1与交互项的共线性。请参见我最近的“如何控制或考虑“控制变量”的影响？”及其续篇中有关如何解决和解读这一问题的叙述。
  - ajun685
    
    2011/08/17 6:40 下午
    
    看了您的这两篇日志。您在“续篇”中讲到不要轻易相信有交互项的模型中系数的显著性，还提到需要结合主效应模型来解释交互项的系数。想确认一下，这是否就是说我问题中的第1种观点是正确的呢？
    感谢老师如此孜孜不倦地为我们广大学子讲解疑难！
zshtom007

2011/08/22 6:58 上午

回复

庄主你好，
想请教下协方差分析（ANCOVA）和半偏相关分析（semi-partial correlation）的差异，谢谢！

如果有回复，麻烦通知我一下，zshtom@gmail.com。非常感谢！
- 庄主
  
  2011/08/23 7:31 上午
  
  回复
  
  zshtom007:
  
  ANCOVA是一种检验多个自变量（分别为定类水平和定距水平）对一个因变量（定距水平）影响的方法、其结果体现为一系列的F-值以及相应的df值、p-值；semi-partial correlation是在扣除了其他（定距水平）自变量的影响之后、一个自变量与一个因变量（均为定距水平）之间的相关系数（即一个统计量）。因此，两者不是直接可比的。请进一步说明你的变量或模型，以便我理解你到底想问什么？
  - zshtom007
    
    2011/09/12 6:10 上午
    
    谢谢庄主回答。
    我想问的是，ANCOVA的思想是控制掉covariate对因变量的影响后，考察其它自变量对因变量的影响。可以有方差解释百分比的指标。
    而semi-partial correlation的思想也是控制掉某一自变量对因变量的影响后，求另外一个因变量和自变量的相关系数，也可有与以上方差解释百分比对应的r-square指标。
    
    我是想问着这种控制covariate的思想之间有什么差别？
  - 庄主
    
    2011/09/25 2:37 上午
    
    已复，见“如何区分协方差分析与半偏差相关分析的差别？”
zhang

2011/09/07 6:12 上午

回复

祝老师，您好，我想用结构方程模型做路径分析，有个问题不清楚，想跟您请教一下。

先说样本量，我调查了100户，也就是我的的样本量是100，假设模型包含4个自变量，其中2个是连续变量，1个是类别变量，1个是计数变量，因变量只有1个，是连续的。

我的模型中有一个中介变量，这个中介变量就是上面提到的类别变量。我主要是想问参数估计方法的选择问题，对于我这样一个小样本量，里面又含有非连续的变量类型，参数估计的方法generalized least square（GLS）和ordinary or unweighted least square (OLS OR ULS)哪个更适合一点？

此外，您觉得我100个样本是否适合做这样一个结构方程模型的路径分析？我是刚开始学SEM，希望能得到您的指点，非常感谢关注，期待您的答复。
telychu

2011/09/23 10:10 下午

回复

庄主：

您好！拜读了您网上博文，学到了很多统计学的知识，在此深表感谢！
我目前正利用SPSS研究某种元器件的使用寿命(Y)，考察X1-X5对Y的影响规律。为此，我搜集了共1050组数据。

初步考察可知，Y不服从正态分布，频数分布图显示其更接近指数分布，但由于在Y=9这一点频数明显高于左右时段，指数分布不成立。

自变量的情况是：X1,X3,X5是定类变量，均为2水平；X4是定序变量，3水平；X2是连续变量，其分布也不满足正态分布，也可以选择将其处理成定序变量，4水平。
我有这样一些问题请您帮忙解答：

1．所有数据是准确无误的，除一个观察的X1缺失外均完整。请问在这种情况下是否需要剔除异常值以排除干扰，使分析结果能够反应绝大部分数据的分布规律呢？比如对于X2，分布范围是16-40，但38-40之间只有少于5个观察，是否应予剔除？

2．自变量各个水平间的样品数很不均匀，例如对于X1，两个水平间的样品量大约是1:9，这种情况可以将X1引入分析模型吗？还是需要将所有数据分成两组讨论？

3．在考察期结束时，仍有部分元件正常使用。这样的案例是否必须使用生存分析的方法来研究？由于该元件的寿命是否超过1年对我的研究意义重大，而考察期结束时仍存活的元件已经超过1年，我是否可以为这部分元件统一指定一个时间（例如考察结束后一个月）为其失效时间，据此计算Y值，从而采用SPSS中的Regression/Binary Logistic过程或者Regression/Ordinal过程？

4．我考虑选择的另外一种处理方法就是将所有变量都处理成分类变量，从而将全体数据视为列联表，采用Loglinear/Logit过程分析。但由于前面提到的自变量各个水平上样品数分布不均匀的问题，将会出现期望频数不满足要求的问题。这是否要求我必须将某些变量舍弃掉，还是在分析过程中采用为每个格子的频数增加一个小常量的方法即可？

5．最后，能否再帮我明确一下对于Regression/Binary Logistic过程和Loglinear/Logit过程分析的前提是怎样的，对于自变量和因变量的要求是什么？很多书都没有提到这个问题，提到的也不是很明确甚至相互矛盾

感谢您在百忙中抽出时间为大家答疑解惑！

Tely
- telychu
  
  2011/10/01 5:27 上午
  
  回复
  
  这几天一直盼着您的回复，刚才上来的时候，发现已经有了答案，帮我澄清了很多疑惑。
  
  多谢！
  
  Tely
zshtom

2011/10/01 1:50 下午

回复

庄主 :
已复，见“如何区分协方差分析与半偏差相关分析的差别？”

非常感谢庄主！
zshtom

2011/10/03 4:51 下午

回复

庄主，再次请教ICC的问题：
https://zjz06.wordpress.com/tag/icc/ 你在这篇ICC的文章里说得很清楚了，我也看并理解了 McGraw & S. P. Wong (1996). Forming inferences about some intraclass correlation coefficients这篇文章里大部分的内容。

但有一点不明白，就是ICC(1/C/A, 1)与ICC(1/C/A, k) 两种模型到底是什么意思【原文p35-36】？ 1的模型表示single score，而k的模型表示average score of k measurements.

但我理解不了，求解！谢谢@
SPSS初学者

2011/10/06 6:28 下午

回复

祝老师您好！我是一个会计专业的SPSS初学者，以下有两个问题想向您请教：
（1）在回归模型中，一般都事先指定了显著性水平（例如，0.05），回归结果中将会报告回归系数对应的P值，如果P值小于0.05，则认为相应的自变量与因变量存在显著关系。在我看到的许多会计类论文中，回归系数的显著性一般用*,**,***来表示在10%、5%、1%的水平上显著，具体也是看对应的P值是否比显著性水平小。如果在回归前已经设定显著性水平为0.05，则某变量的回归系数的P值是0.076，则不应该说存在显著关系。而现在的大多数论文还是将该变量上回归系数上标上*，并称在10%的水平上显著，这样的做法是不是有问题？
（2）利用SPSS做有序的LOGISTICS回归，选项中有LOCATION和SCALE两种模型，如果只做LOCATION，模型拟合情况不太好，将同样的变量选择进入SCALE模型后，模型拟合度变好，且输出表格中多了SCALE模型的结果，而且LOCATION模型中的回归结果与仅做LOCATION模型的结果也不一样。我想请问的是，LOCATION和SCALE模型的结果应如何解释，报告回归结果是应看LOCATION模型的系数和显著性，还是要看SCALE模型的系数和显著性？
期盼您的指点！
Angie

2011/12/31 1:27 下午

回复

祝老师您好，新年好。

我是在美国读书的商科ｐｈｄ学生。在我最近的研究里出现了一个我无法解释的问题，就是我的ＳＥＭ模型里（多组模型）其中一组的一个外生－内生变量之间的loading coefficient大于１。模型拟合度可以。我曾经求教过一位教授，他告诉我，这种现象是可以存在的，没有问题，但是他没有能够推荐给我任何的ｒｅｆｅｒｅｎｃｅ。而我自己在网上查了很久，仍然没有找到答案。所以想在这里向您讨教。谢谢。
- 庄主
  
  2012/01/02 3:39 上午
  
  回复
  
  Angie:
  
  新年好！据我的理解，standardized factor loading/regression coefficient 大于1是有测量模型存在某些问题的症状。就你的案例而言，一种可能是某分组的样本不够大。你有几个组、各自样本多大？
  
  庄主
Angie

2012/01/03 2:19 下午

回复

庄主，谢谢回复。我有两组，N=145和151。

我偶然之间看到了这篇文章，里面说multiple regression的standardized coefficient 如果大于1，不一定说明会有问题，但可能暗示存在multicollinearity。这个是否可以用来解释SEM model? 如果可以，那multicollinearity可否类同于两个latent variable之间存在过大的相关性？我的数据不在手边，不过我会去重新看一下当时CFA的结果。谢谢。

Jöreskog, Karl G. (1999). How large can a standardized coefficient be? http://www.ssicentral.com/lisrel/techdocs/HowLargeCanaStandardizedCoefficientbe.pdf