通过Pandas和Numpy.ndarraytypes将Excelmatrix转换为JSON

我正在从Excel文件中读取matrix。 matrix看起来像这样：

10100300 10100400 10100500 10100600 10100200 243 0 42 54 10100300 243 23 42 5443 10100400 243 110 42 543 10100500 243 0 432 543232342 10100600 243 440 42 544 10100700 243 0 42 54

最终，我希望将其转换为一个字典列表，最后是一个JSON文件。

这看起来像这样：

 [{"Origin" : 10100200, "Destination" : 10100300, "flow" : 243}, {"Origin" : 10100400, "Destination" : 10100300, "flow" : 23}]

首先，我使用pandas来读取这个数据： flows_data_df = pd.read_excel("file.xlsx")

转换为一个numpy数组： flow_data = flows_data_df.as_matrix()

matrix很大，有很多的零，所以我删除它们

clean_flow_data = flow_data[np.all(flow_data == 0, axis=1)]

在这一点上，我卡住了。我如何从numpy.ndarraytypes到JSON ？

假设df是你从Excel中读入的原始dataframe，起源是dataframe的索引，目标是dataframe的列，你可以坚持使用具有to_dict方法的pandas

 (df.stack()[lambda x: x != 0].rename('flow').rename_axis(("Origin", "Destination")) .reset_index().to_dict("records")) #[{'Destination': '10100300', 'Origin': 10100200, 'flow': 243}, # {'Destination': '10100500', 'Origin': 10100200, 'flow': 42}, # {'Destination': '10100600', 'Origin': 10100200, 'flow': 54}, # {'Destination': '10100300', 'Origin': 10100300, 'flow': 243}, # ...

通过Pandas和Numpy.ndarraytypes将Excelmatrix转换为JSON

Excel公式结合2张

Excel：自动将值复制一个等于同一行中非零单元的计数的次数

让Excel根据基于文本的单元格input返回一个date

在一份工作中多次打印相同的工作表

以UTF-8格式导出html表格到Excel文件

如何使用office.js Excel Addin中的行号和列号获取完整的Excel范围地址？

不带标题的Excel上的OLEDB查询：如何指定列？

是否可以部署在Excel中的VB应用程序作为一个独立的应用程序？

删除单元格内的重复项

在Symfony中使用liuggio / ExcelBundle清空PHPExcel文件