在研究Y与X之间的因果关系时,如果Y不是一个定比或定距变量时,就需要进行logistic回归。logistic回归是一种广义线性回归(generalized linear model)。logistic回归根据Y的取值分为三类:

1 二元 logistic回归
二元logistic回归的基本思想是对取某个类别值的概率p进行logit变换,令:
如果:
y=ax+b
则:
2 多元logistic回归
多元logistic回归的基本思想是将取y的某个类别值概率pK作为参照物,将取其他类别值的概率与其相除后取对数,记为yi:
然后对yi进行回归分析得到:
yi=𝛃0+𝛃1*x1+𝛃2*x2……
则:
3 顺序logistic回归
当y是有n(n>2)个取值的定序数据时,分析时可以拆分为n-1个二元logistic回归,分别为(1 vs 2+…+n-1) 、(1+2 vs …+n-1)、(1+…vs n-1),均是较低级与较高级的对比。
logit(p1)=α1+𝛃1*x1+𝛃2*x2+……
logit(p1+p2)=α2+𝛃1*x1+𝛃2*x2+……
y有n个级别,则有n-1个方程。
以下以顺序逻辑回归为例说明在Minitab中如何进行logistic回归分析:
某公司积累了22个项目的历史数据,包括:客户满意度、系统测试时发现的缺陷密度(缺陷个数/功能点)以及项目采用的生命周期模型(瀑布或迭代)。客户满意度为定序刻度,包含 了5个等级:
5很满意
4 满意
3 一般
2 不太满意
1 很不满意
| 序号 | 客户满意度 | 累计测试的缺陷密度 | LCM |
| P1 | 1 | 1.1121 | 瀑布模型 |
| P2 | 3 | 0.5385 | 迭代模型 |
| P3 | 5 | 0.0000 | 迭代模型 |
| P4 | 2 | 0.6656 | 瀑布模型 |
| P5 | 5 | 0.2443 | 迭代模型 |
| P6 | 2 | 0.6262 | 瀑布模型 |
| P7 | 3 | 0.5767 | 迭代模型 |
| P8 | 5 | 0.2434 | 迭代模型 |
| P9 | 5 | 0.2671 | 瀑布模型 |
| P10 | 3 | 0.7158 | 迭代模型 |
| P11 | 4 | 0.5423 | 迭代模型 |
| P12 | 2 | 1.0438 | 瀑布模型 |
| P13 | 1 | 2.4690 | 瀑布模型 |
| P14 | 3 | 0.7160 | 瀑布模型 |
| P15 | 3 | 0.8739 | 瀑布模型 |
| P16 | 2 | 1.0970 | 瀑布模型 |
| P17 | 3 | 0.8531 | 迭代模型 |
| P18 | 3 | 1.0130 | 迭代模型 |
| P19 | 4 | 0.7168 | 迭代模型 |
| P20 | 3 | 0.6926 | 瀑布模型 |
| P21 | 4 | 0.7792 | 迭代模型 |
| P22 | 2 | 0.9906 | 瀑布模型 |
我们拟建立客户满意度与累积测试的缺陷密度和生命周期模型之间的回归关系,因为客户满意度为定序刻度,所以采用有序logistic回归。在Minitab中选中顺序logistic菜单项:

然后设置好模型:

Minitab对上述数据执行分析后,结果如下:


根据上述的结果,可以得到模型如下:
| 满意度等级 | 瀑布模型 | 迭代模型 |
| 等级1的概率 | 1/(1+exp(-(-14.3302+2.78502+9.64861*累计测试缺陷密度))) | 1/(1+exp(-(-14.3302-2.78502+9.64861*累计测试缺陷密度))) |
| 等级1和2的概率 | 1/(1+exp(-(-10.3946+2.78502+9.64861*累计测试缺陷密度))) | 1/(1+exp(-(-10.3946-2.78502+9.64861*累计测试缺陷密度))) |
| 等级1,2,3的概率 | 1/(1+exp(-(-6.33092+2.78502+9.64861*累计测试缺陷密度))) | 1/(1+exp(-(-6.33092-2.78502+9.64861*累计测试缺陷密度))) |
| 等级1,2,3,4的概率 | 1/(1+exp(-(-4.42629+2.78502+9.64861*累计测试缺陷密度))) | 1/(1+exp(-(-4.42629-2.78502+9.64861*累计测试缺陷密度))) |
当采用了瀑布生命周期模型,累计测试缺陷密度为1时,根据上表可以进行预测:
| 序号 | 满意度等级 | 瀑布模型 |
| 1 | 等级1的概率 | 0.1305 |
| 2 | 等级1和2的概率 | 0.8848 |
| 3 | 等级1,2,3的概率 | 0.9978 |
| 4 | 等级1,2,3,4的概率 | 0.9997 |
| 5 | 等级2的概率=(2)-(1) | 0.7543 |
| 6 | 等级3的概率=(3)-(2) | 0.1129 |
| 7 | 等级4的概率=()-(1) | 0.0019 |
| 8 | 等级5的概率=1-(4) | 0.0003 免责声明:本文系网络转载或改编,未找到原创作者,版权归原作者所有。如涉及版权,请联系删 |