Tag: 数据挖掘

通过电子表格值计算最常见的时间: 初步这个问题适用于任何电子表格系统。我希望能够帮助解决问题，而不是回答问题。（虽然后者将是最有用的。）我理解堆栈溢出对于特定的编程问题是有好处的，而且我知道这可能需要我几次尝试才能正确地得到我的问题，所以请通过提供build议来帮助我澄清我的问题，并将对其进行更新。像许多数据新手一样，我对于谨慎的数据（例如上个月有多less个查询）有很好的经验，但是我很难理解如何处理连续的数据（例如，如何发现模式以及查询的标准还不知道）。这个问题我有一个电子表格，每一行代表一个“网站查询”。有一个date时间专栏，我想发现这些数据中的模式，回答如下问题：什么是最常见的时间来接受询问接受询问的一周中最常见的一天是什么？其他有用的信息，我可以从数据中收集，以便让我瞄准可能的客户这与您经常在社交媒体分析中看到的function类似，比如“推特最佳时间”。我明白，计算一周中最常见的一天是非常简单的，因为天是谨慎的对象。所以我不需要帮助！我想避免把这一天分成四个任意时间段（例如早餐，午餐，晚餐，夜间），并计算落入这些界限的行数。如果这些时间段不是最好用来分割数据呢？除了使用任意边界来量化数据之外，还有其他的方法吗？

简单的方法来填写缺失的数据: 我有一个表格，结果来自一个优化algorithm。我有100次运行。 X表示时间，只有存储改进时才存储。所以我已经错过了X – ES。 x1; y1 ; x2 ; y2 1 ; 100 ; 1 ; 150 4 ; 90 ; 2 ; 85 7 ; 85 ; 10 ; 60 10; 80 ; 这只是一个csv。我正在寻找一种方法来轻松地处理这个。因为想要计算每个x值的平均值。所以x = 4时的平均值需要考虑到2的运行，4的y是85。任何使用excel的简单方法。或者在Java或R中读取它？（我会用R的ggplot来绘制日历）。所以预期的输出将如下所示： x1; y1 ; x2 ; y2 1 ; 100 […]

我如何安装“DataMining添加为Office 2007”作为我的设置的一部分？: 我在写一个安装程序，需要安装DataMining Adding for Office 2007。 1）我如何检测它是否已经安装？ 2）如果没有安装，我下载并运行MSI（SQLServer2008_DMAddin.msi）。但是，我怎样才能自己运行服务器configuration（Microsoft.SqlServer.DataMining.Office.ServerConfiguration.exe）工具，而不是在第一次打开Excel时向用户提问？

FCM集群数值数据和csv / excel文件: 您好我问以前的问题，给出了一个合理的答案，我以为我回到了正轨，模糊c-tcp转储聚类在matlab中的问题是下面的tcp / udp数据的预处理阶段，我想通过matlabs fcm聚类algorithm。我的问题： 1）我怎样才能将单元格中的文本数据转换为数字值的最佳方法？数值应该是多less？编辑：我的数据在Excel中现在看起来像这样： 0,tcp,http,SF,239,486,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,8,8,0.00,0.00,0.00,0.00,1.00,0.00,0.00,19,19,1.00,0.00,0.05,0.00,0.00,0.00,0.00,0.00,normal.