Tag: dataframe

将excel或csv文件转换为pandas多级数据框

我已经给了一个相当大的Excel文件(5k行),也作为一个CSV,我想成为一个pandas多级DataFame。 该文件的结构如下所示: SampleID OtherInfo Measurements Error Notes sample1 stuff more stuff 36 6 26 7 37 8 sample2 newstuff lots of stuff 25 6 27 7 测量次数是可变的(有时为零)。 在任何信息之间没有完整的空白行,并且“测量”和“错误”列在具有其他(string)数据的行上是空的; 这可能会使parsing(?)更困难。 有没有简单的方法来自动化这个转换? 我最初的想法是首先用Pythonparsing文件,然后在循环中将数据填充到DataFrame插槽中,但我不知道如何实现它,或者甚至是最佳的操作过程。 提前致谢!