如何从Matlab或Excel中填写缺失的数据集

我得到了一个数据集(每日和每月的降雨量数据),但缺less这么多的价值。 为了训练我需要的数据来填补遗漏的数据,你能告诉我怎么做? 我用SPSS统计,但似乎价值不佳,也许我做了错误的方法。

sample: Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 3 3 5 5 6 7 8 7 8 9 NaN 4 NaN 3 NaN 5 NaN 3 4 NaN 4 6 7 8 7 NaN 4 7 8 9 4 2 NaN 4 6 5 ..................................................... 

另一个问题是,大多数训练前的数据应该是归一化的数据,这是正确的吗? 谢谢你的回答! 圣诞节快乐!

对于缺失的数据,您可以select现有数据的mean来模拟丢失的数据。 例如,你在Jan NaNmean(3, 7) = 5来填充NaN ,依此类推。 我想这可能是最简单的方法。 你也可以考虑matrix分解和曲线拟合。

对于规范化,一些分类器不需要规范化的数据。 但是,将数据标准化通常是提高性能的一个好方法。 对于neural network,已知归一化数据是非常受欢迎的。 所以不要犹豫,去做吧。

Ctrl+G ,然后点击Special ,然后检查Formulas ,然后确保只有Errors被选中,然后单击OK 。 这将select所有有错误的单元格。 然后你可以按Delete来清除他们的内容。

我有时使用公式创build第二个表格,将这个表格的值转换为原始值或更容易pipe理的表格,如此处所示 。

Interesting Posts