线性回归与逻辑回归的区别
线性回归和逻辑回归都是研究因变量的影响因素,但它们应用于不同类型的因变量。
-
线性回归:因变量是连续型的(例如量表题可以看作连续型数据)。如果自变量有多个,就称为多元线性回归,若只有一个自变量,则是简单线性回归。
-
逻辑回归:因变量是分组型的,例如性别、年级等分类变量(对于二分类变量使用二元逻辑回归,对于多分类变量使用多元逻辑回归)。
步骤
-
对量表维度计算平均值:
- 转化 > 计算变量
- 目标变量输入维度名称,数字表达式输入
mean(维度下第一题 to 维度下最后一题)
- 例如(题目名称不用手动输入,直接点击左侧对应标签即可):
- 例如(题目名称不用手动输入,直接点击左侧对应标签即可):
- 对所有维度执行相同操作。
-
选择回归分析:在菜单栏中,依次点击“分析” > “回归” > “线性”。
-
设置变量:在弹出的对话框中,将因变量拖入“因变量”框,将自变量拖入“自变量”框。
-
选择统计量:点击“统计量”按钮,勾选“共线性诊断”和“德宾-沃森(U)”
-
生成图表:在“图”选项中输入
Y:\*ZRESID; X:\*ZPRED
,并勾选直方图(H)和正态概率图(R)。
结果解读
模型摘要
R方: 是自变量(预测变量)对因变量(被预测变量)方差的解释比例。 举例来说,若R方=0.799,意味着预测变量可以解释因变量变化的79.9%。通常,R方大于50%就说明模型具备较好的解释力。 调整后R方: 对R方的修正,考虑了自变量数量的影响。增加自变量时,R方可能增大,即使新增的变量并不具有预测能力。调整后R方通过对不显著变量的惩罚,使得模型拟合度评估更为准确。 德宾-沃森:又称“D-W值”。 用于检测模型残差的自相关性。值接近2表示残差间没有显著的自相关性。若值小于2,表示正自相关,若大于2,表示负自相关。 举个例子,德宾-沃森值为1.972,接近2,说明模型残差之间几乎没有显著自相关性,样本独立性基本通过。
ANOVA
显著性p值小于0.05时,表明至少有一个自变量对因变量有显著影响,意味着模型具有统计学意义。
系数
-
显著性<0.05:表示该自变量对因变量有显著影响。若某个变量的显著性大于0.05,则应考虑去除该变量并重新进行回归分析。
-
VIF<5(有时标准为<10):表示不存在多重共线性,结果准确可靠。如果某个变量的VIF值超过此范围,则需考虑去除该变量并重新检验。
-
回归方程:最终的回归方程为:
因变量 = ∑B × 自变量- B为未标准化的回归系数,加上常量;
- beta(标准化回归系数)不包括常量。
图
- 直方图:理想的分布呈现“低-高-低”的钟形分布。
- P-P图:数据点应沿对角线分布,表明数据与正态分布的一致性。
word解释
R 方 | 调整后 R 方 | 德宾-沃森 | P |
---|---|---|---|
0.795 | 0.792 | 2.018 | <0.001 |
a 预测变量:(常量), 个体创新, 促进因素, 价格价值, 社会影响 b 因变量:使用意愿
根据表格,调整后的R方为0.792,表示预测变量能够解释使用意愿变化的79.2%。德宾-沃森系数为2.018,接近2,表明模型残差之间几乎没有自相关性,因此数据之间具有独立性。模型的P值小于0.05,意味着模型显著,且自变量能够解释因变量的变化。
维度 | 回归系数 | 显著性 | 容差 | VIF |
---|---|---|---|---|
促进因素 | 0.217 | <0.001 | 0.253 | 3.96 |
社会影响 | 0.115 | 0.033 | 0.279 | 3.583 |
价格价值 | 0.416 | <0.001 | 0.355 | 2.82 |
个体创新 | 0.24 | <0.001 | 0.366 | 2.736 |
a 因变量:使用意愿 |
回归方程为:
使用意愿 = 0.217 * 促进因素 + 0.115 * 社会影响 + 0.416 * 价格价值 + 0.24 * 个体创新
从表格可以看出,所有自变量的显著性均小于0.05,且VIF均小于5,说明不存在多重共线性,模型有效且自变量可以充分解释因变量。