需要帮助计数从Excel数据出售的单位
我已经将一个excel电子表格导入R studio,我需要为这些数据编写R命令。 我需要一个命令来显示一个物品已经卖出了多less次。 数据看起来有点像这样
PRODUCT ------------------- UNITS eye liner ----------------------- 10 lip gloss ----------------------- 5 eye liner ----------------------- 10 lip gloss ----------------------- 5
我不知道如何计算已售出多less单位的唇彩。 我能做的最好的是显示唇彩在命令中显示的次数:
nrow(mySales[mySales$Product=="lip gloss",])
这个命令不会计算出多less单位的唇彩出售数量是10,它只计算唇彩在数据(2)中出现的次数。 这是一个初学者课程,这是第一个练习,我认为这是一个简单的问题,但我完全失去了。
你几乎在那里。 如果你看看你的代码:
nrow(mySales[mySales$Product=="lip gloss",])
这一行在这里:
mySales[mySales$Product=="lip gloss",]
将具有产品的数据称为唇彩
当您添加nrow
您正在计算新子集数据中的行数
因此,你可以通过使用函数行来获得总数。因此,你需要做的下一步可以用rowSum来代替rowSum
,或者如果你将新数据rowSum
的单位列
sum(mySales[mySales$Product=="lip gloss",]$UNITS)
inheritance人一步一步的版本
lipGlossSales<- mySales[mySales$Product=="lip gloss",] lipGlossUnits <-lipGlossSales$UNITS totallipGloss <- sum(lipGlossUnits)
Happy R-ing
干杯,
这被称为拆分 – 应用 – 组合方法,并且在数据分析中有很好的logging和非常常见。 在这种情况下,我会尝试plyr库,它允许作出这样的数据很好的总结:
fakedata <- data.frame(Product=c('eye liner', 'lip gloss', 'eye liner', 'lip gloss'), count=c(10,5,10,5)) library(plyr) product.counts <- ddply(fakedata, "Product", function(x) data.frame(Productcount = sum(x$count))) R> product.counts Product Productcount 1 eye liner 20 2 lip gloss 10