将Excel文件加载到numpy 2D数组中
有没有更容易的方法来加载一个Excel文件直接到一个Numpy数组?
我已经从numpy文档中查看numpy.genfromtxt
自动加载function,但不直接加载excel文件。
array = np.genfromtxt("Stats.xlsx") ValueError: Some errors were detected ! Line #3 (got 2 columns instead of 1) Line #5 (got 5 columns instead of 1) ......
现在我正在使用openpyxl.reader.excel
读取excel文件,然后附加到numpy的2D数组。 这似乎是低效的。 理想情况下,我想不得不将excel文件直接加载到numpy 2D数组中。
老实说,如果你正在处理异构数据(电子表格可能包含),使用pandas.DataFrame
是比直接使用numpy
更好的select。
虽然pandas
在某种意义上只是一个包装,它处理异构数据非常非常好。 (以及其他许多事情……对于“电子表格式”的数据,这是Python世界的黄金标准。)
如果你决定走这条路线,只需使用pandas.read_excel
。