需要帮助计数从Excel数据出售的单位

我已经将一个excel电子表格导入R studio,我需要为这些数据编写R命令。 我需要一个命令来显示一个物品已经卖出了多less次。 数据看起来有点像这样

PRODUCT ------------------- UNITS eye liner ----------------------- 10 lip gloss ----------------------- 5 eye liner ----------------------- 10 lip gloss ----------------------- 5 

我不知道如何计算已售出多less单位的唇彩。 我能做的最好的是显示唇彩在命令中显示的次数:

 nrow(mySales[mySales$Product=="lip gloss",]) 

这个命令不会计算出多less单位的唇彩出售数量是10,它只计算唇彩在数据(2)中出现的次数。 这是一个初学者课程,这是第一个练习,我认为这是一个简单的问题,但我完全失去了。

你几乎在那里。 如果你看看你的代码:

nrow(mySales[mySales$Product=="lip gloss",])

这一行在这里:

mySales[mySales$Product=="lip gloss",]

将具有产品的数据称为唇彩

当您添加nrow您正在计算新子集数据中的行数

因此,你可以通过使用函数行来获得总数。因此,你需要做的下一步可以用rowSum来代替rowSum ,或者如果你将新数据rowSum的单位列

sum(mySales[mySales$Product=="lip gloss",]$UNITS)

inheritance人一步一步的版本

lipGlossSales<- mySales[mySales$Product=="lip gloss",] lipGlossUnits <-lipGlossSales$UNITS totallipGloss <- sum(lipGlossUnits) Happy R-ing

干杯,

这被称为拆分 – 应用 – 组合方法,并且在数据分析中有很好的logging和非常常见。 在这种情况下,我会尝试plyr库,它允许作出这样的数据很好的总结:

 fakedata <- data.frame(Product=c('eye liner', 'lip gloss', 'eye liner', 'lip gloss'), count=c(10,5,10,5)) library(plyr) product.counts <- ddply(fakedata, "Product", function(x) data.frame(Productcount = sum(x$count))) R> product.counts Product Productcount 1 eye liner 20 2 lip gloss 10