Tag: 统计

如何使用Excel在正常分布内生成随机数字: 我想在Excel中使用RAND（）函数来生成一个介于0和1之间的随机数。但是，我希望80％的值落在0和0.2之间，90％的值落在0和0.3之间，95％的值落在0和0.5之间等等。这让我想起我从前曾经应用过统计学课程，但是并没有学到什么课程。如何使用Excel公式来实现这个结果的最好方法是什么？或者，这种统计计算是什么？我可以谷歌周围的任何其他指针。 ================= 用例：我有一个单一的米读数，我想重复7次（每一个新的一个月）。每列有55000行。虽然每个月的读数需要变化，但按照时间序列，每个读数应该有7个现实的读数。其目的是产生现实的数据转化为热图（即标志偏远的抄表）

滑动平均或滑动平均: 我需要计算实验数据的滑动或滑动平均值。你能指导我如何做滑动平均？我无法find它的参考。我只find关于移动平均线的一些信息。移动平均线是否与滑动平均线相同？感谢Karunaras

在excel中查找四分位数的不同策略: 让我们考虑下面的数据 9 5 3 10 14 6 12 7 14 我想find`Q1，Q2，Q3，让数据sorting 3 5 6 7 9 10 12 14 14 在Excel中，我们可以很容易地计算出来 =QUARTILE(A2:A10,1) =QUARTILE(A2:A10,2) =QUARTILE(B2:B10,3) 结果是 6 9 12 但如果我们手工计算，我们会得到以下结果 5.5 9 13 为什么结果如此不同？提前致谢

在Excel中使用sumif的隐式数组: 我想知道是否有可能使用隐式或“嵌套”数组的SUMIF函数。对于“隐式”数组，我的意思是一个matrix，其中的数据不是电子表格中任何级别的最终forms，而是其他数组的function。例如，假设我们有等级A1：A100中的一个自variables（其值，所有整数，范围从0到5）的数据，以及B1：B100中的因variables的数据。有了SUMIF函数，我们可以很容易地计算，例如，独立variables为4时的因variables之和。但是如果我们想要知道因variables的SQUARES的总和，这并不容易，SUMIF函数给出如果我们写入SUMIF（A1：A100; 4; B1：B100 ^ 2），无论我们如何input它（作为数组或作为一个简单的公式），都会出错。有没有什么办法可以做到这一点，而不必浪费列B值的平方整列？我知道，就这个例子而言，函数SUMPRODUCT（（A1：A100 = 4）* B1：B100 ^ 2）将完成这项工作，我不知道如何“嵌套”数组（这是非常有用的）一般。

Excel 2016 – 如何确定我应该使用哪一列来帮助我预测实际数字？: 我有3列，猜猜一个数字应该是什么，然后是实际的数字列。我需要从math上确定一些事情。（每列是一个预测，有三个来源。）哪一列是最接近实际的列。哪一列最接近实际列，但比实际列大。（主pipe宁可猜测高低。）我应该用哪一列来帮助我预测下一年的实际数字。我不确定我是否应该只使用条件格式，或者使用大于或小于百分比的列。你有什么build议，你会怎么做？谢谢！

检查kurtois和skewnes为正常variables: 我使用分析toolpak技术，根据excel中的正态分布产生了随机variables 我需要知道的是为什么这个正常variables的kurtois不等于3？这里是计算kurtois的excel公式 =KURT(A2:A2001) and its corresponding value is equal to `0.14521546` 这是否意味着3只在无穷大样本的情况下？对于特定量的样品幅度范围在-1和1之间变化。这里也是计算skewnes的公式 =SKEW(A2:A2001) -0.006510255 提前致谢

2组数据之间的自动function: 在Excel中，我有一列x值和一列y值。我需要将x和y值相乘，但是我有100组值。我怎样才能创build一个公式，将这样做的所有数据？谢谢。

R：是否有相当于Stata的codebookout命令？: 在Stata中，我可以使用codebookout命令创build一个Excel工作簿，该工作簿可以保存现有数据集中所有variables的名称，标签和存储types及其相应的值和值标签。我想在R中find一个等价的函数。到目前为止，我已经遇到了memisc库，它有一个叫做codebook的函数，但是和Stata不一样。例如，在Stata中，码本的输出看起来像这样…（见下面 – 这是我想要的） Variable Name Variable Label Answer Label Answer Code Variable Type hhid hhid Open ended String inter_month inter_month Open ended long year year Open ended long org_unit org_unit long Balaka 1 Blantyre 2 Chikwawa 3 Chiradzulu 4 即数据框中的每列被评估为产生5个不同列的值： variables名称是列的名称 variables标签这是列的名称答案标签是列中的唯一值。如果没有唯一的值，则认为是开放式的应答码，是答案标签中每个类别的数字分配。如果答案标签不是分类，则为空。 variablestypes：int，str，long（date）… 这是我的尝试： CreateCodebook <- function(dF){ numbercols <- […]

如何计算配对数字的模式值？: 我的Excel电子表格包含来自二维空间的500个坐标点。我想要find这500个坐标点的模式值。任何一组数值的模式值估计都非常简单。这只是这组数字中高度重复的数字。在excel中： =MODE (A1:A10) 产生从A1到A10的数据模式。但是，坐标点是一对x和y坐标。单独计算x和y坐标的模式值可能会导致错误，因为单独的x坐标可能与许多y坐标配对，反之亦然。 excel中是否有公式可以获得二维坐标点等配对数的模值？

将相似的名字转换成数字: 我有不同的基因型，他们的血统有很多父母 genotypes parents G1 mac cemolt giza G2 mac miser G3 misr cemolt mac NE10 我有很多基因型，我想做一个matrix，其中包括每两个基因型之间的共同父母，所以它应该看起来像 G1 G2 G3 G1 0 1 2 G2 2 我怎样才能做到这一点？