Tag: pandas groupby

分组,分类,pandas累计总和

我正在从excel Countifs / Sum转换到Pandas。 在Pandas中,我希望对某些input数据进行分组,累积和,然后将其作为输出表写入csv。 我的input表是每个项目发生时间标记的项目列表,如: import pandas as pd df_in = pd.DataFrame({ 'Date' :[pd.Timestamp('20130101'),pd.Timestamp('20140101'),pd.Timestamp('20150101'),pd.Timestamp('20160101'),pd.Timestamp('20160101'),pd.Timestamp('20160101')], 'Type' : ['item1','item2','item2','item1','item1','item1'], 'Proj' : ['PJ1','PJ1','PJ1','PJ1','PJ2','PJ2']}) #giving Proj Date Type PJ1 2013-01-01 item1 PJ1 2014-01-01 item2 PJ1 2015-01-01 item2 PJ1 2016-01-01 item1 PJ2 2016-01-01 item1 PJ2 2016-01-01 item1 我想在一系列用户定义的时间窗口中对每个项目的每个项目types进行累计总和(最后,我希望每个项目在一个时间段(月,季度,年度等)实现的累计项目数量。 我的输出(binned到结束date)应该看起来像 Proj Date_ item1 item2 PJ1 2014-01-01 1.0 1.0 PJ1 2016-01-01 […]