过滤pandas数据透视表

我试图通过SQL查询为Pandas提供一些数据，然后将旋转结果保存到.csv文件中。到目前为止我已经成功了。

import cx_Oracle import pandas as pd query = """ SELECT dt, --Workstack, GM, COUNT(JOB_NUMBER) FROM MY_TABLE GROUP BY dt, --Workstack, GM """ connection = cx_Oracle.connect("<My_Username>", "<My Password>", "<Database String>") df = pd.read_sql_query(query, connection) piv = df.pivot(index='GM', columns='DT', values='COUNT') print (piv.head()) piv.to_csv('''Workstack.csv''')

现在我希望包含查询variables中使用的“Workstack”字段，并且还希望使用“pandas”过滤不同string的字段“工作包”，然后将其粘贴为不同的csv文件或在同一个Excel文件中。但是，当我在查询中包括工作堆python给了我这个错误…

ValueError: Index contains duplicate entries, cannot reshape

任何想法如何解决这个问题？最终，我想要使用python Excel模块将上面的数据透视表粘贴到不同的单元格和工作表上。

感谢🙂

尝试使用聚合函数的pivot_table ：

 piv = df.pivot_table(index='GM', columns='DT', values='COUNT', aggfunc='sum')

 import cx_Oracle import pandas as pd query = """SELECT * FROM MY_TABLE""" print('Loading Query') connection = cx_Oracle.connect("Username", "Password", "Data Connection") df = pd.read_sql_query(query, connection) PivotTable = df.loc[df['ColumnName'] == "ValueinColumn"].pivot_table(index='SelectRows', columns='SelectColumns', values='SelectValues', aggfunc='SelectAggregation') print ("Writing to Excel") ExcelWorkbook = pd.ExcelWriter('Data.xlsx') PivotTable.to_excel(ExcelWorkbook, sheet_name='PivotTable', startrow=1) ExcelWorkbook.save() print ("Closing Connection") connection.close() print('Section Complete')

过滤pandas数据透视表

date范围内数据的总和，其中date是文本

需要一个简单的searchfunction来显示列中最常见的值。（含糊不清的select）

带有寄存器的枢轴表在2行中重复

在Excel 2010中生成数据透视表的VBA代码

Excel 2016数据透视表 – 更改数据源不正确更新

保存Excel表的数据透视表caching

最好build立一个SQL查询或外推另一个程序？

无法设置PivotItem类的Visible属性

Telerik PivotGrid列configuration

基于编程生成的logging集的数据透视表缺less刷新button

过滤pandas数据透视表

date范围内数据的总和，其中date是文本

需要一个简单的searchfunction来显示列中最常见的值。 （含糊不清的select）

带有寄存器的枢轴表在2行中重复

在Excel 2010中生成数据透视表的VBA代码

Excel 2016数据透视表 – 更改数据源不正确更新

保存Excel表的数据透视表caching

最好build立一个SQL查询或外推另一个程序？

无法设置PivotItem类的Visible属性

Telerik PivotGrid列configuration

基于编程生成的logging集的数据透视表缺less刷新button

需要一个简单的searchfunction来显示列中最常见的值。（含糊不清的select）