了解逻辑回归的结果

让我们假设我们有以下数据与二进制响应输出(优惠券)

在这里输入图像说明

每年消费在第1000个单位,我的目标是估计客户是否花2000多,并有Simmons卡,也将有优惠券,首先我根据反应数据sorting数据,我有下图

在这里输入图像说明

在下一阶段,我已经计算出每个数据的logit,对于那些最初我select下面的系数

B0 0.1 B1 0.1 B2 0.1 

我已经按照下面的公式计算了L

在这里输入图像说明

在下一阶段,我已经计算出e ^ L(这在Excel中可以通过exp函数轻松完成)

 =EXP(D2) 

之后,我有计算概率

 =E2/(1+E2) 

在这里输入图像说明

最后用公式 在这里输入图像说明

我已经计算了对数似然函数

那么我已经计算出了总和,并使用求解器我已经计算出的系数,使这个总和最小(请注意,值给出了负值),但我已经得到所有系数为零

在这里输入图像说明

我错了 ? 或者这是否意味着我可以预测年度支出和拥有Simmons卡购买优惠券? 提前致谢

您可以根据年度消费预测购买优惠券(并且了解Simmons卡不会有帮助)。

诚然,我没有在Excel中解决它,但我怀疑问题可能是你的优化没有收敛(即通过求解过程没有达到正确的系数) – 正确的系数是B0 = 5.63,B1 = -2.95,B2 = 0。我在http://blog.excelmasterseries.com/2014/06/logistic-regression-performed-in-excel.htmlfind了Excel逻辑回归程序的在线参考。

我自己运行逻辑回归,发现年度支出是显着的(在0.05水平),而Simmons卡不是。 使用Simmons卡重新运行模型将产生以下等式:

  L = 5.63 - 2.95 * Annual spending P(1) = exp(L)/(1 + exp(L)) If P(1) > 0.5 => coupon = 1 

虽然熵方差在0.39(数据点的数量非常less),但是该模型具有统计显着性。