结构方程模型：罄竹难书 | /cn/2008/01/why-i-hate-structural-equation-models/

yihui 2022-12-16 14:08:55

https://yihui.org/cn/2008/01/why-i-hate-structural-equation-models/

11 Comments

giscus-bot 2022-12-16 14:08:55

访客 *colinisstudent* @ 2008-01-10 23:35:01 写道：

PLS似乎会好一点

yihui 2022-12-16 14:09:06

PLS比起协方差建模方法是要稍微好一点点，但PLS同样也仅仅只利用了协方差的信息，相比之下其优点在于计算的复杂性大大降低了，求特征向量/特征根的问题我们完全是有把握的，而SEM协方差建模的方法中，求那个目标函数的极小值根本就是非常扯的事情，难以想象。

——原帖发布于 2008-01-11 09:48:51

giscus-bot 2022-12-16 14:08:56

访客 *deadwind* @ 2008-01-11 08:54:38 写道：

…………师兄说的确实也有道理，不过貌似现在在社会科学领域结果方程还是挺吃香，我们这学期刚学完的结构方程，我的领悟还不深，不过其中一点是结构方程主要目的是做CFA，所以做结果方程之前的理论建构应该是更好总要的吧

yihui 2022-12-16 14:09:05

我想它popular的一点重要原因就是可以任人摆布，要想做出一个SEM不支持的理论，难

——原帖发布于 2008-01-11 09:43:22

giscus-bot 2022-12-16 14:08:57

访客 *deadwind* @ 2008-01-11 08:56:20 写道：

对了把这篇贴网址推荐到到我们班级学习的GOOGLE group 了，师兄不介意吧

yihui 2022-12-16 14:09:04

No problem

Originally posted on 2008-01-11 09:21:38

giscus-bot 2022-12-16 14:08:58

访客 *lixiaoxu* @ 2008-01-14 17:29:51 写道：

SEM的应用确实很值得反思甚至反动，但不是在所提的三个问题的层面上。

第一个问题：经过数理统计专业训练的同行应该知道充分统计量这个概念。SEM在理论上也有考虑进偏度、峰度的模型(Bentler为首的研究团队一直在推这种叫做ADF的模型)，只是在应用中明显处于劣势被淘汰。因为需要的样本量太多，在小样本时没用；但在大样本时，普通的正态假设模型就已经很好用了。

第二个问题：计算复杂性问题是软件和算法研究者做的事情，应用者不应该牵扯详细的迭代过程，只需要知道迭代是否收敛。对于常见的SEM模型和不过分少的样本量，收敛不是问题。lisrel软件设计者对计算复杂性的政策是：如果有异样，就原样报告给用户，不给掩盖问题的缺省方案。

第三个问题：RMSEA的区间估计有明确的统计意义，可以告诉使用者“贵模型有能力近似地描述当前样本”或"贵模型没能力近似地描述当前样本"或"样本太少，证据不足"。

我的意见：

SEM的致命伤是前提太多，用家经常混淆什么是模型的前提，什么是模型所检验的结论。输入的整个框架是模型的前提，谁指向谁、谁解释谁，这些信息的90%不是模型检验的结论，而是模型的前提。因为前提实在太多了，所以（前提&结果）就太容易被质疑。但（前提-->结果）极严谨，并无破绽。正如
SEM的极端特例线性回归，使用者不应该从回归模型的整体显著去说其中的变量满足回归式子的线性关系。如果线性回归的模型报告说某某回归系数的区间估计是如何如何，那是在假定变量满足线性+同方差+正态等等一揽子假设之后才能得到的结论。对这种前提和结果的分量不成比例的研究模式，通常只能让步说，我的模型是这套数据多么好一个候选解释，而很难说数据证明了我的模型多么地唯一正确或者客观正确。

SEM比简单的线性回归多出来的一个麻烦是因子命名的效度，“几若善博者呼卢成卢，喝雉成雉”。但效度这样一个争吵了几十年的老问题，SEM不过是雨露均沾，不足为致命伤。

@lixiaoxu

yihui 2022-12-16 14:09:07

多谢李老师的教诲！

1、我一直都在想的问题是，若只用协方差的信息建模，那么意思就是说，只要两批样本的协方差矩阵相同，那么在结构方程模型的眼中，这两批样本就没有任何区别，我觉得这是不合理的。另外，我从您说的ADF模型中看出您似乎有点误解我的意思了，我不是说数据是否服从正态分布的问题（这也是问题之一），而是说对数据的信息利用充分程度。另外，我不知道协方差矩阵是不是充分统计量（初步感觉应该不是），还望老师指点。

2、这一点也要请教老师，应用者通常有没有注意两个问题：（1）对于如此高度复杂的优化问题，是否多次更改迭代初始值，让程序多次计算并检验计算结果的稳定性；（我所了解的一位老师就完全没有意识到这个问题的重要性，这让我非常吃惊）（2）有没有尝试类似leave-one-out之类的算法，随意删掉一条样本记录，再重新计算，看结果是否有大的波动。我认为在SEM的计算过程中，这两点是一定要做的，而我所读到的论文似乎都很少提及这些事情，因此我很怀疑那些看似漂亮的结果背后隐藏着多大的不稳定性。

3、我的意思是，SEM的思想源自一个假设检验，那么这就注定我们只有把握拒绝这个模型，而当我们作出“接受某个模型”的决定时，我们是很难意识到犯第II类错误的危险的。至于RMSEA之类的辅助指标，基本上都取决于怎样定义S和Sigma之间的差异，而这个差异要怎样小才算小，多大又算大？也是没有一定之规，RMSEA<0.05就是好模型吗？不一定。

至于您提到的因子命名的问题，就是更麻烦的问题了，几乎就没办法讲理了……我甚至想知道有没有SEM做不出来的理论（东家一套命名，西家一套命名，大家各自都能得到SEM的支持）。

以上四个问题中，有两个是Norman Cliff(1983)提到过的。我觉得对于SEM的研究者来说，这篇论文还是非常有价值的。

——原帖发布于 2008-01-15 20:06:17

giscus-bot 2022-12-16 14:08:59

访客 *lixiaoxu* @ 2008-01-16 06:29:34 写道：

闻道先后，术业专攻，不合适“教诲”这么重的语气。

任何两套数据，如果任意阶样本矩都相同，就一定完全一样。任何两个总体分布，如果任意阶总体矩都存在且相同，就一定完全一样。早年创办Biometrika的那些先驱相信前4阶矩就完全决定一个分布。如今在社会科学领域，许多学者认为这个数学上错误的观点对现实中被研究的总体基本可以被接受。实际上，在SEM领域，前2阶矩就被认为是足够了。简单说就是近似正态，到底有多近似，则不是SEM的结论而是前提。如果对此无法接受，可以退一步想最简单的线性回归，是不是所有协方差信息和均值信息就决定了最终的结果。

当然，样本量充分多时，也就是总体已知时，可以知道两个变量之间的预测关系的非线性成分。线性回归可以引入二阶项、交互项，但SEM照样也有类似的扩展。

SEM研究的对象是总体的二阶中心矩，所以样本的二阶中心矩就是充分统计量。

计算迭代的结果可靠性，是经验问题。你说的那两件必须做的事情，假如有一个可接受的明确标准，那就是必须由软件去做。现行的标准反映了圈内学者经验上的共识，要挑战这个共识，怀疑论是不够的。而且，如果一个不够优的迭代结果就能给出一个足够窄的RMSEA区间，即使有一个更优的结果，只会更窄的置信区间。
N Cliff(1983)的问题之一，数据只拒绝而不证实模型。这里的模型主要是指结构方程的变量结构关系。从等价模型的普遍存在，学界已经很清楚SEM不能排除其他备择模型，因为后者在SEM框架里统计上完全等价。所以，得到的统计量只能回答某某模型能多么好地解释总体二阶矩。这个多么好，就是RMSEA的区间估计。RMSEA其实是一个标准化Effect Size。任何一个假设检验的问题，都有类似的Effect Size vs p的困扰。Cohen的d，线性回归的R^2如果有所谓大中小共识，RMSEA就有所谓小中大共识。
N Cliff(1983)的问题之二：可能只有学心理计量的学生才有机会去读那一摞Validity的文献。其实在操作层面，大部分时候针对validity的批评者不能提出明显更优的备择项。可能的冲突在于理科生习惯怀疑论语境，文科生习惯诸如结构主义或者存在主义之类某种语境。当然，二者的共识应该是，命名注定有一部分理据是在统计结论之外。

@lixiaoxu

yihui 2022-12-16 14:09:08

从您的回复中我的确又学到了一些新的东西（准确地说是视角），所以“教诲”也不为过啦，呵呵

1、这么想倒也有道理，统计的祖宗之一Pearson做的工作确实是在计算前四阶矩。

2、我这么看重计算的问题，是因为我感觉国内的统计氛围中，对统计计算忽视得太严重了，尤其是过于依赖软件，我是非常支持开源软件的，因此对于无法看到源代码的软件始终有种不信任的感觉，把具体的计算过程封闭起来不让别人看到，这样谁都无法了解计算中是否存在bug。R里面有sem包，所以我可以从其源代码中看见John Fox用的是nlm()函数来完成最小化，而LISREL用的是什么方法来最小化目标函数的呢，官方网站上似乎没有提及这件事。

3、RMSEA不是SQRT[(Chi^2 - df / (N - 1))/df]么？这里面看不出它有上界吧？因为没有上界（参照物），所以就无法判断多小算作足够小。统计里面有些指标是有范围的，像您提到的R^2，如果不钻牛角尖，我们还是可以讲0.9算大0.1算小的，因为它的取值在[0，1]之间。而且，在ML估计的情况下，即使Chi^2=0、RMSEA=0，也反推不出S=Sigma（这二者之间没有if and only if的关系）。

4、我个人的意思是，模型的灵活性是好的，但SEM也未免太灵活了。

——原帖发布于 2008-01-16 10:58:22

giscus-bot 2022-12-16 14:09:00

访客 *lixiaoxu* @ 2008-01-16 14:21:14 写道：

不同的SEM软件，||sigma(heta) - S||^2的最小化很容易互相比拼，这是它们公开竞争的地方，实现过程虽是黑箱，但结果可由市场优胜劣汰。所以不会有哪种能卖得开的软件会在这一点上留出破绽。学界颇有些专家和期刊专门品评这些行世软件的技术要点，为普通用户作守夜人。
iris正在和我们合写一篇解释这类困惑的中文文章。平时所见RMSEA和Cohen's d，都是点估计。当n无限增大，就逼近到对应的总体参数。置信区间，就是对这个总体参数的估计。关于RMSEA的置信区间，可参考Browne & Cudeck (1993). RMSEA也正因为可以报告置信区间而被MacCallum & Austin (2000)重点推荐。

Browne, M. W., & Cudeck, R. (1993). Alternative ways of assessing model fit. In (ed.) Bollen, K. A. & Long, J. S., Testing Structural Equation Models, 136-61. Newbury Park, CA: Sage

MacCallum, R.C., & Austin, J.T. (2000) Applications of structural equation modeling in psychological research. Annual Review of Psychology, 51, 201-226.

@lixiaoxu

yihui 2022-12-16 14:09:09

好的，等有空我争取读一读您提到的文章，也期待你们的作品：）

非常感谢您的意见，难得我的Blog上有如此充分的交流 😁

——原帖发布于 2008-01-16 21:05:51

giscus-bot 2022-12-16 14:09:01

访客 *tianfeng* @ 2008-04-14 08:59:23 写道：

我这个学期有选SEM的课，当然是在社会科学领域。我认为SEM最方便的地方在于它灵活的建模方式，提供了一种方便的把理论转化为模型的思路。我主要是从这个角度来使用SEM，而至于你说的variance-covariance矩阵方面的质疑，并未做太多考虑。可能我们做社会科学的就像你所说的那样，做出漂亮的Chi2和RMSEA就不去考虑别的条件。这方面应该加强。

如果不麻烦的话，可否请你解释一下那个所谓几阶样本距的概念么？或者推荐一些基本的文献参考。

I am wondering whether you are the person I met in Renmin Univ.

yihui 2022-12-16 14:09:10

概率论或者数理统计的书。

我记得你的邮箱，你应该没认错人：）

——原帖发布于 2008-07-01 02:54:40

giscus-bot 2022-12-16 14:09:02

访客 *April* @ 2009-12-07 15:19:32 写道：

呵呵，正在考虑用SEM来做课题设计后续部分的数据分析探讨，见前辈对SEM的口诛毛伐，有点迟疑。呵呵，不过，不得不说，前辈揭的SEM的痛处是其硬伤，我得再备加斟酌或择或弃：》

yihui 2022-12-16 14:09:10

不要受我蛊惑，我发牢骚只是SEM这个东西几乎人人都说好，越说越神奇，这就有问题了。自己好好琢磨琢磨吧。

——原帖发布于 2009-12-08 06:20:03

giscus-bot 2022-12-16 14:09:03

访客 *April* @ 2009-12-08 12:35:39 写道：

呵呵，也是，贫僧之前所见，几乎悉奉之为统计学的里程碑。今闻前辈醍醐灌顶，始明需冷眼观之。借哲学的辩证法之说，便是事物矛盾的双重性所在了：》

giscus-bot 2022-12-16 14:09:04

访客 *vermouth86* @ 2014-01-06 15:00:05 写道：

AMOS最大的问题就在于，改模型只需画线，但模型估计、拟合全是黑箱操作，很容易滥用。。。

hezhan9986 2023-04-17 08:18:38

我的天哪，我完全支持谢老师的观点！真的是完全说出了我的心声！最近在做研究时对SEM产生了深深的思考：我为什么要做它，它能解决什么实际问题？
感谢谢老师的博文，让我豁然开朗！谢谢！非常感谢！相见恨晚！

yihui 2023-04-17 13:45:23

年少无知的我凶狠起来我自己都害怕，哈哈。后面我还发过好几篇牢骚：