SAS,Python,Excel创build不断更新function

我有一个非常大的数据集。 我一直在做SAS; 然而,我很乐意使用Python和excel(只有擅长的细节 – 我从来没有在这里编程)。 每个按时间顺序排列的观察者都有一个识别号码。 在一些行中,我有一个二进制观察值,分别表示由1或0标记的“成功”或“失败”。 我想再添加三列(在每一行包含成功/失败),有成功总数(累计)和失败总数(积累),以及之间的比例他们俩。 这个比例是微不足道的。 然而,我只是不知道如何做前两个。 任何帮助将不胜感激。 谢谢!

作为更新:这是我的数据集的一个想法:

ID Success Failure totaSuccess totalFailure ratio 1234 - - - - - 1234 1 0 1 0 1/(1+0) 2345 - - - - - 2345 0 1 0 1 0/(1+0) 1234 0 1 1 1 1/(1+1) 

 PROC SORT DATA = HAVE; BY ID; RUN; DATA WANT / VIEW = WANT; SET HAVE; BY ID; IF FIRST.ID THEN DO; TOTALSUCCES = 0; TOTALFAILURE = 0; END; TOTALSUCCES + SUCCESS; TOTALFAILURE + FAILURE; RUN; 

在SAS中,您可以创build一个视图,以便随着表更新而更新。 不pipe你使用什么解决scheme,重要的是澄清你的表是如何更新的。

 data have; do id=1 to 10; numobs=ceil(rand('uniform')*5); do i=1 to numobs; value=rand('bernoulli', 0.3); output; end; end; drop i numobs; run; proc sql; create view want as select id, value, sum(value) as success, count(value)-sum(value) as failure, sum(value)/(count(value)) as ratio from have group by id; quit;