公式根据5组分布的均匀程度进行评分

我有5桶年龄段:年龄小于25岁,25-34岁,35-44岁,45-54岁,55岁以上

我想要一个公式来根据5个组的分布情况创build一个分数。 例如,如果5个桶中每个桶的人数相同,我希望得分为100,如果5个桶中只有1个桶中有人(最差分布),我希望得分为零。

如果您将五个桶的值放入单元格A1E1那么下面的数组公式会给出一个相当好的估计值:

 =STDEV.S((A1:E1)/AVERAGE(A1:E1))/2.25 

请注意,这是一个数组公式,需要使用Ctrl + Shift + Enter (而不是Enter )来input 。 您将看到Excel通过在公式中自动添加曲线括号(无需自己添加它们)来将公式识别为数组公式

 {=STDEV.S((A1:E1)/AVERAGE(A1:E1))/2.25} 

说明:基本上, 标准偏差的定义是你要找的: “量化变化量的一种方法”

然而,由此产生的标准差的价值将依赖于基础价值,不会给你从0%到100%的均匀价差。 因此,我使用AVERAGE()实现了所有值相同的比较度量。 但是,您也可以使用SUM() 。 之后,您将其中一个 “桶”设置为任意数量,其余桶将设置为零,然后您将获得所需的除数,以确保结果总是在0到100之间。

所以, {=STDEV.S((A1:E1)/AVERAGE(A1:E1))}将是2.23607...我将其舍入到2.25 。 用{=STDEV.S((A1:E1)/SUM(A1:E1))}你会得到类似0.44721...可以四舍五入到0.45

我相信一个更精明的用户也许能够解释如何计算最后一点信息,而不是像我一样估计它。 但不幸的是,我无法这样做。 但是,如果你真的好奇,那么你可能想重新发表这个关于数据科学的问题,我相信你会find一个人用math术语来解释这个问题。