Tag: 统计

如何使用Excel在正常分布内生成随机数字

我想在Excel中使用RAND()函数来生成一个介于0和1之间的随机数。 但是,我希望80%的值落在0和0.2之间,90%的值落在0和0.3之间,95%的值落在0和0.5之间等等。 这让我想起我从前曾经应用过统计学课程,但是并没有学到什么课程。 如何使用Excel公式来实现这个结果的最好方法是什么? 或者,这种统计计算是什么?我可以谷歌周围的任何其他指针。 ================= 用例: 我有一个单一的米读数,我想重复7次(每一个新的一个月)。 每列有55000行。 虽然每个月的读数需要变化,但按照时间序列,每个读数应该有7个现实的读数。 其目的是产生现实的数据转化为热图(即标志偏远的抄表)

滑动平均或滑动平均

我需要计算实验数据的滑动或滑动平均值。 你能指导我如何做滑动平均? 我无法find它的参考。 我只find关于移动平均线的一些信息。 移动平均线是否与滑动平均线相同? 感谢Karunaras

在excel中查找四分位数的不同策略

让我们考虑下面的数据 9 5 3 10 14 6 12 7 14 我想find`Q1,Q2,Q3,让数据sorting 3 5 6 7 9 10 12 14 14 在Excel中,我们可以很容易地计算出来 =QUARTILE(A2:A10,1) =QUARTILE(A2:A10,2) =QUARTILE(B2:B10,3) 结果是 6 9 12 但如果我们手工计算,我们会得到以下结果 5.5 9 13 为什么结果如此不同?提前致谢

在Excel中使用sumif的隐式数组

我想知道是否有可能使用隐式或“嵌套”数组的SUMIF函数。 对于“隐式”数组,我的意思是一个matrix,其中的数据不是电子表格中任何级别的最终forms,而是其他数组的function。 例如,假设我们有等级A1:A100中的一个自variables(其值,所有整数,范围从0到5)的数据,以及B1:B100中的因variables的数据。 有了SUMIF函数,我们可以很容易地计算,例如,独立variables为4时的因variables之和。但是如果我们想要知道因variables的SQUARES的总和,这并不容易,SUMIF函数给出如果我们写入SUMIF(A1:A100; 4; B1:B100 ^ 2),无论我们如何input它(作为数组或作为一个简单的公式),都会出错。 有没有什么办法可以做到这一点,而不必浪费列B值的平方整列? 我知道,就这个例子而言,函数SUMPRODUCT((A1:A100 = 4)* B1:B100 ^ 2)将完成这项工作,我不知道如何“嵌套”数组(这是非常有用的)一般。

Excel 2016 – 如何确定我应该使用哪一列来帮助我预测实际数字?

我有3列,猜猜一个数字应该是什么,然后是实际的数字列。 我需要从math上确定一些事情。 (每列是一个预测,有三个来源。) 哪一列是最接近实际的列。 哪一列最接近实际列,但比实际列大。 (主pipe宁可猜测高低。) 我应该用哪一列来帮助我预测下一年的实际数字。 我不确定我是否应该只使用条件格式,或者使用大于或小于百分比的列。 你有什么build议,你会怎么做? 谢谢!

检查kurtois和skewnes为正常variables

我使用分析toolpak技术,根据excel中的正态分布产生了随机variables 我需要知道的是为什么这个正常variables的kurtois不等于3? 这里是计算kurtois的excel公式 =KURT(A2:A2001) and its corresponding value is equal to `0.14521546` 这是否意味着3只在无穷大样本的情况下? 对于特定量的样品幅度范围在-1和1之间变化。 这里也是计算skewnes的公式 =SKEW(A2:A2001) -0.006510255 提前致谢

2组数据之间的自动function

在Excel中,我有一列x值和一列y值。 我需要将x和y值相乘,但是我有100组值。 我怎样才能创build一个公式,将这样做的所有数据? 谢谢。

R:是否有相当于Stata的codebookout命令?

在Stata中,我可以使用codebookout命令创build一个Excel工作簿,该工作簿可以保存现有数据集中所有variables的名称,标签和存储types及其相应的值和值标签。 我想在R中find一个等价的函数。到目前为止,我已经遇到了memisc库,它有一个叫做codebook的函数,但是和Stata不一样。 例如,在Stata中,码本的输出看起来像这样…(见下面 – 这是我想要的) Variable Name Variable Label Answer Label Answer Code Variable Type hhid hhid Open ended String inter_month inter_month Open ended long year year Open ended long org_unit org_unit long Balaka 1 Blantyre 2 Chikwawa 3 Chiradzulu 4 即数据框中的每列被评估为产生5个不同列的值: variables名称是列的名称 variables标签这是列的名称 答案标签是列中的唯一值。 如果没有唯一的值,则认为是开放式的 应答码,是答案标签中每个类别的数字分配。 如果答案标签不是分类,则为空。 variablestypes:int,str,long(date)… 这是我的尝试: CreateCodebook <- function(dF){ numbercols <- […]

如何计算配对数字的模式值?

我的Excel电子表格包含来自二维空间的500个坐标点。 我想要find这500个坐标点的模式值。 任何一组数值的模式值估计都非常简单。 这只是这组数字中高度重复的数字。 在excel中: =MODE (A1:A10) 产生从A1到A10的数据模式。 但是,坐标点是一对x和y坐标。 单独计算x和y坐标的模式值可能会导致错误,因为单独的x坐标可能与许多y坐标配对,反之亦然。 excel中是否有公式可以获得二维坐标点等配对数的模值?

将相似的名字转换成数字

我有不同的基因型,他们的血统有很多父母 genotypes parents G1 mac cemolt giza G2 mac miser G3 misr cemolt mac NE10 我有很多基因型,我想做一个matrix,其中包括每两个基因型之间的共同父母,所以它应该看起来像 G1 G2 G3 G1 0 1 2 G2 2 我怎样才能做到这一点?