通过在Excel / python中对行进行分组来评估平均值
我有一个如下所示的csv
文件(这只是一个简单的例子;我的实际文件包括成千上万行):
Main Submain Date Counter A A-0 2017-06-09 10 C C-0 2017-06-09 18 B B-0 2017-06-09 20 A A-1 2017-06-09 12 B B-0 2017-06-30 5
我想要做的是当两个或更多的行具有相同的主要和date,然后我想要评估平均和( 可选地创build一个新的csv文件),其中包含如下信息(这对应于以前的最小的例子)。
Main Date Counter A 2017-06-09 11 C 2017-06-09 18 B 2017-06-09 20 B 2017-06-30 5
我会更感兴趣在Excel
中做这件事(因为我认为这是更容易实现),但python
也是好的。
您可以根据您的数据创build数据透视表并按date查看平均计数器,
删除小计,重复标题来调整格式,
如果你还想在Python中尝试它:
import pandas as pd df1 = pd.read_csv("test.csv") df2 = df1.groupby(["Main","Date"]).mean() df2.to_csv("testgrouped.csv")
这将在“testgrouped.csv”文件中给出相同的结果:
Main,Date,Counter A, 2017-06-09,11 B, 2017-06-09,20 B, 2017-06-30,5 C, 2017-06-09,18