如何从Matlab或Excel中填写缺失的数据集
我得到了一个数据集(每日和每月的降雨量数据),但缺less这么多的价值。 为了训练我需要的数据来填补遗漏的数据,你能告诉我怎么做? 我用SPSS统计,但似乎价值不佳,也许我做了错误的方法。
sample: Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 3 3 5 5 6 7 8 7 8 9 NaN 4 NaN 3 NaN 5 NaN 3 4 NaN 4 6 7 8 7 NaN 4 7 8 9 4 2 NaN 4 6 5 .....................................................
另一个问题是,大多数训练前的数据应该是归一化的数据,这是正确的吗? 谢谢你的回答! 圣诞节快乐!
对于缺失的数据,您可以select现有数据的mean
来模拟丢失的数据。 例如,你在Jan
NaN
取mean(3, 7) = 5
来填充NaN
,依此类推。 我想这可能是最简单的方法。 你也可以考虑matrix分解和曲线拟合。
对于规范化,一些分类器不需要规范化的数据。 但是,将数据标准化通常是提高性能的一个好方法。 对于neural network,已知归一化数据是非常受欢迎的。 所以不要犹豫,去做吧。
按Ctrl+G
,然后点击Special
,然后检查Formulas
,然后确保只有Errors
被选中,然后单击OK
。 这将select所有有错误的单元格。 然后你可以按Delete
来清除他们的内容。
我有时使用公式创build第二个表格,将这个表格的值转换为原始值或更容易pipe理的表格,如此处所示 。