四阶和五阶多项式回归不能在Excel中工作

我在Excel中做多项式回归有一个奇怪的问题。 和以前一样,我试图获得Excel在graphics上创build多项式趋势线时使用的正确系数。 我已经阅读了如何使用LINEST来做这件事,在做二阶和三阶回归的时候,我已经能够得到符合趋势线公式的答案…但是当我尝试第四或第五时,答案与Excel在趋势线公式上显示我。

下面是图表中的数据和我在5阶回归中的尝试: 单击Excel工作簿

任何人有任何想法可能会导致我麻烦?

谢谢!

-Jon

输出中的零值是(多)共线性的结果。 从MSfunction帮助:

“… LINEST函数检查共线性,并从回归模型中删除任何多余的X列,当它们识别它们时,被删除的X列可以在LINEST输出中被识别为除了0个值之外还具有0个系数….”

为了更准确的估计,将LINEST与以均值为中心的x值相乘并且乘以二项系数的matrix。 所以代替:

 =LINEST(B2:B31,A2:A31^{1,2,3,4,5}) 

试试:

=MMULT(LINEST(B2:B31,(A2:A31-AVERAGE(A2:A31))^{1,2,3,4,5}),IFERROR(COMBIN({5;4;3;2;1;0},{5,4,3,2,1,0})*(-AVERAGE(A2:A31))^({5;4;3;2;1;0}-{5,4,3,2,1,0}),0))

这与趋势线值一致。

另见: https : //newtonexcelbach.wordpress.com/2011/02/04/fitting-high-order-polynomials/ (发表和评论)

你可能是过度配合; 实际上,如果你使用5阶多项式,我会说你可能是。 如果多项式的阶数高于阶数3(有时候甚至高于阶数1!),那么你的“趋势线”就会冒险进入外层空间。 当你经历了一定程度的复杂性时,你将模型拟合成数据点的随机变化,而不是产生数据的底层机制。

避免这个问题的一个方法是使用像岭回归这样的正则化机制。 Christopher Bishop的“ 模式识别与机器学习”一书就这个话题进行了精彩的讨论,并给出了一个很好的例子来说明如何正则化多项式回归。

顺便说一句,我不会使用Excel进行统计分析。 这里是一篇关于Excel 计算统计和数据分析日志的Excel统计function的文章(我第一次在另一个stackoverflow文章中看到了这个链接;但是我不记得在哪里;对于没有给出适当的功劳的原始海报道歉): http: //www.pages.drexel.edu/~bdm25/excel2007.pdf