通过在Excel / python中对行进行分组来评估平均值

我有一个如下所示的csv文件(这只是一个简单的例子;我的实际文件包括成千上万行):

 Main Submain Date Counter A A-0 2017-06-09 10 C C-0 2017-06-09 18 B B-0 2017-06-09 20 A A-1 2017-06-09 12 B B-0 2017-06-30 5 

我想要做的是当两个或更多的行具有相同的主要和date,然后我想要评估平均和( 可选地创build一个新的csv文件),其中包含如下信息(这对应于以前的最小的例子)。

 Main Date Counter A 2017-06-09 11 C 2017-06-09 18 B 2017-06-09 20 B 2017-06-30 5 

我会更感兴趣在Excel中做这件事(因为我认为这是更容易实现),但python也是好的。

您可以根据您的数据创build数据透视表并按date查看平均计数器,

在这里输入图像说明

删除小计,重复标题来调整格式,

在这里输入图像说明

在这里输入图像说明

如果你还想在Python中尝试它:

 import pandas as pd df1 = pd.read_csv("test.csv") df2 = df1.groupby(["Main","Date"]).mean() df2.to_csv("testgrouped.csv") 

这将在“testgrouped.csv”文件中给出相同的结果:

 Main,Date,Counter A, 2017-06-09,11 B, 2017-06-09,20 B, 2017-06-30,5 C, 2017-06-09,18