Tag: 正常化

在Excel中规范化0到1的数据

我需要Excel中的数据以0和1之间的归一化值进行返回。在另一个论坛上,我尝试了公式=A1-MIN($A$1:$A$8)/(MAX($A$1:$A$8)-MIN($A$1:$A$8))返回与A1相同的值。 不知道我错了哪里。 数据如下,但是应该在0和1之间 24778.0 25439.0 26372.0 16833.0 20909.0 202182.0 15041.0 5573.0

转换一个表格 – 用分号分隔的值将列转换为带有是/否条目的多列

我想将我当前的表格转换成可以轻松过滤的表格。 我有一个表,其中第一列是一个唯一的标识符,第二列是用分号分隔的与该条目相关的问题列表。 除此之外,我还有一些精心定义和列出的专栏。 我的表可能看起来像这样: |ID|Issue|Title| |ABC.001.0001|Green; Blue|Around and up| |ABC.001.0002|Green; Orange|Over and beyond| |ABC.001.0003|Pink; Orange|Inside out| 每个| 上面代表表格中列的末尾。 我想转换表易于使用和发布易于过滤。 这将是一个好的结果: |ID|Green|Blue|Orange|Pink|Title| |ABC.001.0001|Yes|Yes|No|No|Around and up| |ABC.001.0002|Yes|No|Yes|No|Over and beyond| |ABC.001.0003|No|No|Yes|Yes|Inside out| 我不想写很多代码。 我想find一些库,可以在几个步骤,如R或八度做转换。 否则,也许有一些步骤可以在MS Excel和MS Access中获得相同的结果。 只是作为一个侧面的问题这个转换叫什么? 整洁的数据? 正常化? 改写(munging)?

标准化线图以更好地显示随时间的微小变化

我有一个线条图,描绘了我的工作场所的人数。 我们想创build一个线条图来描绘离开和join公司的人的趋势,但是我们已经注意到,有一些我们已经知道的,每年都在期待的趋势,并且不希望它反映在图中,因为它掩盖真实的人们离开和进来。我们注意到的人是夏季来临的实习生,每年有大约100名实习生。 我想以某种方式“正常化”我的图表,以便大量的实习生进来不会造成高峰,他们离开不会引起大的下滑。 我想捕捉的尖峰和涟漪是人们辞职/退休,人们被雇用。 我怎么去做这个? (我正在使用Excel生成这些图表)

与.Resize和UBound函数(Visual Basic)

我完全不熟悉Visual Basic,并试图创build一个将使用我的Excel工作表并将其规范化的macros。 以下是我的数据示例: 完整的数据跨越200列和近5万行。 这就是我最终希望我的数据看起来如何: 规范化的数据 我在网上find一些代码来做到这一点,但其中一行有一个错误,我不知道有什么问题。 这里是代码: Sub TransposeRows() Dim vIn, i As Long, j As Long, vOut, lngCnt As Long Dim lngLastRow As Long, lngLastCol As Long, vFirstRow lngLastRow = Cells(Rows.Count, 1).End(xlUp).Row lngLastCol = Cells(1, Columns.Count).End(xlToLeft).Column vFirstRow = Range("A2", Cells(1, lngLastCol)).Value vIn = Range("A2", Cells(lngLastRow, lngLastCol)).Value ReDim vOut(1 To (lngLastCol – 1) * […]

SQL:如何正确存储来自外部Excel文档源的数据?

我正在使用SQL Server 2008,我正在使用导入向导导入数据。 我有像以下的Excel文件中的数据… SessionID Email SubmitTime Question1 Question2 Question3 ———- —– ———– ——— ——— ———- 54535212 a@b.com 12/21/2011 Yes No Yes 54532342 c@d.com 12/22/2011 Yes Yes Yes 54535288 e@f.com 12/23/2011 No No Yes 54532399 g@h.com 12/24/2011 No Yes Yes 现在我想将它存储在我的数据库中,以便我可以轻松访问数据。 我想我应该做一个Users Table , Questions Table , Answers Table , Submitted Table 。 为了我的目的,提交的表格可以成为用户表格的一列。 User […]

转换Excel文件的工具? (交换列,基本的string操作等)

我需要将表格数据导入到我的数据库中。 数据通过电子表格(主要是Excel文件)从多方提供。 这些文件中的每一个的格式都是相似的,但是并不相同,并且需要进行各种转换来将数据转换为适合导入的最终格式。 此外,input格式将来可能会改变。 我正在寻找一种可以由普通用户运行和pipe理的工具来转换input文件。 现在让我列出一些我正在做的转换: 交换列: input是: |Name|Category|Price| |data|data |data | 输出是 |Name|Price|Category| |data|data |data | 重命名列 input是: |PRODUCTNAME|CAT |PRICE| |data |data|data | 输出是 |Name|Category|Price| |data|data |data | 根据查找表映射列,就像上面的例子中一样:在列中将“car”replace为“car” 基本math:将价格栏乘以某个因子 基本的string操作可以说,价格列的格式是“3 x $ 45”,我想分成两列的数量和价格 按值过滤行:排除包含单词“expensive”的所有行 等等 我有以下要求: 它可以在以下任何平台上运行:Windows,Mac,Linux 开源,免费软件,共享软件或商业 转换需要通过GUI进行编辑 如果该工具需要最终用户培训才能使用,那不是问题 它可以处理1000-50000行的顺序 基本上我正在寻找一个graphics工具来帮助用户对数据进行标准化处理,这样就可以导入数据了,而不需要编写一堆适配器。 你用什么工具来解决这个问题?

使用VBA快速规范数据(Excel)

我目前正试图用Excel中的VBA规范化数据。 因此,我的工作簿导入几个csv文件,并将它们写入不同的工作表中,所有这些文件都是这样构build的。 第一行:标题 第一列:x轴(绘图) 第二列到第n列:y值 现在我想将从2到n的所有列标准化(除以每列的最大值)。 这是我目前使用的function: Sub NormalizeData(dataName) cs = Worksheets(dataName).UsedRange.SpecialCells(xlCellTypeLastCell).Column rs = Worksheets(dataName).UsedRange.SpecialCells(xlCellTypeLastCell).Row For col = 2 To cs maxValue = Application.WorksheetFunction.Max(Worksheets(dataName).Columns(col)) For r = 2 To rs Worksheets(dataName).Cells(r, col) = Worksheets(dataName).Cells(r, col) / maxValue Next r Next col End Sub 这种方法是有效的,但是由于数据量很大,所以速度很慢。 有没有办法提高速度? 我已经切换了屏幕更新。 非常感谢您的帮助!

映射略有不同的多个文件中的多个列

我正在寻找一种很好的实用方法来解决在Talend中批量ETL作业的多个文件之间具有略微不同的模式的元数据规范化问题。 我有几百个历史报告(每个25K到200K左右的logging),每个excel文件大约有100到150个列。 大部分列名对于所有文件都是相同的(98%重叠),但是存在微妙的差异: 不同的列顺序 不同的列名称(有时使用,有时不使用缩写) 不同的列数 有时,单词之间有空格,有时也有点,短划线或下划线 等等 写一个专门的应用程序或暴力破解所有的文件,通过手动纠正它们,是否有任何好的免费工具或方法,可以在智能或半自动化方式提供文件列名之间的差异和纠正?

规范化数据从1到10进行缩放

我有一个下面的数据集: ABN 1 3 10 2 3 5 3 3 1 3 6 5 10 10 1 20 41 5 20 120 9 我正在寻找一个Excel函数,将A和B的规范化从1到10的规模。 在上面的例子中是这样的 1 of 3 is best so N = 10 2 of 3 is in the middle N = 5 3 of 3 is worst N=1 20 of 120 is in […]

如何在Excel中执行0到1规范化

我有一个包含一些数字的列的Excel文件,我需要使用此公式x-min(分布)/ max(分布)-min(分布)规范0和1之间的分布。 任何帮助将不胜感激。