分析如何使用Excel嘈杂的数据集
我有一组数据,在Excel中有超过15,000条logging,这些logging来自一个可以发现大面积趋势的测量工具。 我没有兴趣在整个数据中寻找趋势,而是对数据最接近的数据感兴趣,以了解它是如何嘈杂(与邻居logging的差异)。 几乎就像我想知道一次仅查看20条logging的15000条logging的平均标准偏差。 希望是数据价值的趋势是逐渐的,而不是从logging到logging的突然变化,因此看起来很嘈杂。 如果我添加一个图表,并使用“移动平均线”趋势线,则可以直观地显示数据在15,000条logging中的嘈杂程度。 但是,我希望能得到一个数值来评价数据与其他数据集有多嘈杂。 任何想法,我可以在这里用公式的内置Excel或通过添加一些加载项? 让我知道如果我需要更好地解释这一点。
你能计算一下你20个样本窗口的移动平均值,然后用每个点与期望值之间的差值来计算方差吗?
很难在这里做表,但这里是我的意思的样本
Actual Measured Expected Variance 5 5.44 4.49 0.91 6 4.34 5.84 2.26 7 8.45 7.07 1.90 8 6.18 7.84 2.75 9 8.89 9.10 0.04 10 11.98 10.01 3.89
“测量”值确定为
measured = actual + (rand() - 0.5) * 4
“预期”值是根据移动平均值计算的(表格从数据集的中间拉出)。
方差是简单的预期减去测量的平方。
然后,您可以计算平均方差作为汇总统计。
移动平均线是正确的,但你需要一个关键的因素 – 订单。 你是date/时间variables还是序列号?
使用OFFSET
function设置您的窗口。 如果你想要20,你的公式会看起来像AVERAGE(OFFSET(C15,-10,0,21))
。 这是你的移动平均线。
把它和C15
相关,无论是加法还是乘法,你都会有距离。 我们现在需要的是你的宽容。