Tag: 数据挖掘

通过电子表格值计算最常见的时间

初步 这个问题适用于任何电子表格系统。 我希望能够帮助解决问题,而不是回答问题。 (虽然后者将是最有用的。) 我理解堆栈溢出对于特定的编程问题是有好处的,而且我知道这可能需要我几次尝试才能正确地得到我的问题,所以请通过提供build议来帮助我澄清我的问题,并将对其进行更新。 像许多数据新手一样,我对于谨慎的数据(例如上个月有多less个查询)有很好的经验,但是我很难理解如何处理连续的数据(例如,如何发现模式以及查询的标准还不知道) 。 这个问题 我有一个电子表格,每一行代表一个“网站查询”。 有一个date时间专栏,我想发现这些数据中的模式,回答如下问题: 什么是最常见的时间来接受询问 接受询问的一周中最常见的一天是什么? 其他有用的信息,我可以从数据中收集,以便让我瞄准可能的客户 这与您经常在社交媒体分析中看到的function类似,比如“推特最佳时间”。 我明白,计算一周中最常见的一天是非常简单的,因为天是谨慎的对象。 所以我不需要帮助! 我想避免把这一天分成四个任意时间段(例如早餐,午餐,晚餐,夜间),并计算落入这些界限的行数。 如果这些时间段不是最好用来分割数据呢? 除了使用任意边界来量化数据之外,还有其他的方法吗?

简单的方法来填写缺失的数据

我有一个表格,结果来自一个优化algorithm。 我有100次运行。 X表示时间,只有存储改进时才存储。 所以我已经错过了X – ES。 x1; y1 ; x2 ; y2 1 ; 100 ; 1 ; 150 4 ; 90 ; 2 ; 85 7 ; 85 ; 10 ; 60 10; 80 ; 这只是一个csv。 我正在寻找一种方法来轻松地处理这个。 因为想要计算每个x值的平均值。 所以x = 4时的平均值需要考虑到2的运行,4的y是85。 任何使用excel的简单方法。 或者在Java或R中读取它? (我会用R的ggplot来绘制日历)。 所以预期的输出将如下所示: x1; y1 ; x2 ; y2 1 ; 100 […]

我如何安装“DataMining添加为Office 2007”作为我的设置的一部分?

我在写一个安装程序,需要安装DataMining Adding for Office 2007。 1)我如何检测它是否已经安装? 2)如果没有安装,我下载并运行MSI(SQLServer2008_DMAddin.msi)。 但是,我怎样才能自己运行服务器configuration(Microsoft.SqlServer.DataMining.Office.ServerConfiguration.exe)工具,而不是在第一次打开Excel时向用户提问?

FCM集群数值数据和csv / excel文件

您好我问以前的问题,给出了一个合理的答案,我以为我回到了正轨, 模糊c-tcp转储聚类在matlab中的问题是下面的tcp / udp数据的预处理阶段,我想通过matlabs fcm聚类algorithm。我的问题: 1)我怎样才能将单元格中的文本数据转换为数字值的最佳方法? 数值应该是多less? 编辑:我的数据在Excel中现在看起来像这样: 0,tcp,http,SF,239,486,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,8,8,0.00,0.00,0.00,0.00,1.00,0.00,0.00,19,19,1.00,0.00,0.05,0.00,0.00,0.00,0.00,0.00,normal.