如何在Excel中基于关联/回归来恢复(预测)数据?
我有一些特征(高度)与输出variables(价格)相关的数据。 如何基于这些variables之间的现有依赖性(相关性)来恢复高度特征中缺失的数据(空)?
更清楚的是:
input和输出variables有明确的相关性。 我想,预测excel的缺失值并不是一个困难的过程。 但是我需要一些方法来实现它。
如果得到E2和E3(比如说)中回归线的斜率(m)和截距(c):
=SLOPE(C2:C9,B2:B9) =INTERCEPT(C2:C9,B2:B9)
你可以重新安排简单的回归方程y = mx + c来预测x值
x=(yc)/m
所以你预测的高度是:
=IF(ISBLANK(B2),(C2-E$3)/E$2,B2)
从D2开始。
您可以尝试FORECAST¹function 。 第一个空白没有足够的前面的数据来生成预测结果,所以简单的比例就足够了,但是可以生成其余的值,并且将其先前生成的预测结果考虑到它们自己的结果中。
E2中的公式是,
=IF(ISBLANK(B2), FORECAST(C2, B$2:B$9, C$2:C$9), B2)
¹ 请参阅数据预测中备选algorithm的预测function 。