步骤
-
选择分析方法:点击菜单栏中的
分析
->回归
->多项Logistic...
,打开多元逻辑回归对话框。 -
设置变量:
- 因变量(Dependent):将多分类因变量拖入此框。
- 因子(Factors):将分类自变量拖入此框。
- 协变量(Covariates):将连续自变量拖入此框。
-
设置参考类别:
- 点击
参考类别
按钮,选择基准类别。
- 点击
回归方程
在多项Logistic回归分析中,我们使用对数概率(log odds)来表示每个类别的可能性。
$$ \ln \left( \frac{P_1}{P_3} \right) = B_0 + B_1 X_1 + B_2 X_2 + \cdots + B_n X_n $$ $$ \ln \left( \frac{P_2}{P_3} \right) = B_0 + B_1 X_1 + B_2 X_2 + \cdots + B_n X_n $$ 对数概率:
$$ a = \left( \frac{P_1}{P_3} \right) = e^{B_0 + B_1 X_1 + B_2 X_2 + \cdots + B_n X_n} $$ $$ b = \left( \frac{P_2}{P_3} \right) = e^{B_0 + B_1 X_1 + B_2 X_2 + \cdots + B_n X_n} $$ $$ P_1 = \frac{a}{a + b + 1}, \quad P_2 = \frac{b}{a + b + 1}, \quad P_3 = 1 - P_1 - P_2 = \frac{1}{a + b + 1} $$ 概率:
推导过程:
已知条件:
$$ a = \frac{P_1}{P_3}, \quad b = \frac{P_2}{P_3} $$步骤 1:推导出 (P_1) 和 (P_2)
从给定的公式:
$$ a = \frac{P_1}{P_3} \quad \Rightarrow \quad P_1 = a \cdot P_3 $$ $$ b = \frac{P_2}{P_3} \quad \Rightarrow \quad P_2 = b \cdot P_3 $$步骤 2:利用 (P_1 + P_2 + P_3 = 1)
根据概率的总和公式,我们有:
$$ P_1 + P_2 + P_3 = 1 $$将 (P_1) 和 (P_2) 代入上式:
$$ a \cdot P_3 + b \cdot P_3 + P_3 = 1 $$步骤 3:提取公共因子 (P_3)
将 (P_3) 提取出来:
$$ P_3 (a + b + 1) = 1 $$步骤 4:解出 (P_3)
解出 (P_3):
$$ P_3 = \frac{1}{a + b + 1} $$步骤 5:求出 (P_1) 和 (P_2)
将 (P_3 = \frac{1}{a + b + 1}) 代入之前推导的 (P_1) 和 (P_2):
$$ P_1 = a \cdot \frac{1}{a + b + 1} = \frac{a}{a + b + 1} $$ $$ P_2 = b \cdot \frac{1}{a + b + 1} = \frac{b}{a + b + 1} $$$$ P_1 = \frac{a}{a + b + 1}, \quad P_2 = \frac{b}{a + b + 1}, \quad P_3 = \frac{1}{a + b + 1} $$ 最终结果:
解释
表格:
模型拟合信息:如果显著性值(p值)小于0.05,意味着模型在统计上是显著的,能够有效地反映自变量与因变量之间的关系。
伪R方:
伪R方用于评估模型的拟合效果,它是衡量模型预测与实际观测数据之间匹配度的指标。常用的伪R方有以下几种: 6. 麦克法登伪R方:适用于离散选择模型,广泛应用于经济学和社会科学的研究,推荐优先使用。 7. 内戈尔科伪R方:对麦克法登伪R方的调整,使得模型拟合度的范围更加直观。 8. 考克斯-斯奈尔伪R方:另一种常见的伪R方估算方法。
这些伪R方的值越高,说明模型的拟合效果越好。
参数估算值:
回归方程中的系数(B值)表示自变量对因变量的影响强度与方向,Exp(B)则表示对应变量对因变量的几率比。通过这些参数可以更直观地了解每个变量对模型预测的贡献。
小结:
这篇文章详细介绍了多项Logistic回归的步骤、回归方程的推导过程,以及如何解释回归结果。通过理解模型的拟合信息、伪R方以及参数估算值,读者可以更好地理解回归分析的意义和应用。