混合模型

作者

Mixture model

发布于

2025年8月8日

1 什么是混合模型

混合模型指的是包含分类潜变量的模型。

混合模型包含两部分:测量模型结构模型

测量模型是多元回归模型,多元回归模型的自变量是分类潜变量,多元回归模型的结果变量是外显变量,这些外显变量被称为潜类别指标。多元回归模型界定了分类潜变量与其指标之间的关系。下图是一个测量模型,class是分类潜变量,indicator1indicator5是其潜类别指标。数据中存在indicator1indicator5这些变量,但不存在class这一变量,class是通过indicator1indicator5推断出来的。

flowchart TB
    A((class)) ---> B[indicator1] & C[indicator2] & D[indicator3] & E[indicator4] & F[indicator5]

潜类别分析 (Latent Class Analysis, LCA)是测量模型。当潜类别指标是连续变量时,潜类别分析常被称为潜剖面分析 (Latent Profile Analysis, LPA),即潜剖面分析是潜类别分析的特例。

结构模型界定了三种关系:分类潜变量之间的关系,显变量之间的关系,分类潜变量与显变量之间的关系。针对不同类型的结果变量,结构模型采用不同的统计方法检验变量间的关系:

结构模型用到的统计方法
结果变量的类型 统计方法
连续变量 一般线性回归
无序类别变量 多项逻辑回归
截断膨胀变量 截断正态回归
二分类变量,有序分类变量 逻辑回归
计数变量 泊松或零膨胀泊松回归方程

2 Mplus中混合模型的拓展

  • 多组分析。混合模型的多组分析使用VARIABLE中的KNOWNCLASS命令。
  • 缺失值。可用LISTWISE
  • SUBPOPULATION的作用是选择部分数据用来分析。
  • 嵌套数据。使用ANALYSIS中的TYPE=COMPLEX,配合使用VARIABLE中的STRATIFICATIONCLUSTERWEIGHT
  • 潜变量的交互作用。使用MODEL中的|XWITH命令界定。
  • 随机斜率。用MODEL中的|ON
  • 参数限制。用MODEL CONSTRAINT命令。
  • 算法。ANALYSIS中的ESTIMATOR
  • Bootstrap标准误。 ANALYSIS中的BOOTSTRAP
  • Bootstrap置信区间。ANALYSIS中的BOOTSTRAP,配合OUTPUT中的CINTERVAL
  • 参数限制检验。MODEL中的MODEL TEST,或MODEL CONSTRAINT配合Wald chi-square test
  • 潜类别之间均值的恒等性。使用AUXILIARY