通过电子表格值计算最常见的时间

初步

这个问题适用于任何电子表格系统。 我希望能够帮助解决问题,而不是回答问题。 (虽然后者将是最有用的。)

我理解堆栈溢出对于特定的编程问题是有好处的,而且我知道这可能需要我几次尝试才能正确地得到我的问题,所以请通过提供build议来帮助我澄清我的问题,并将对其进行更新。

像许多数据新手一样,我对于谨慎的数据(例如上个月有多less个查询)有很好的经验,但是我很难理解如何处理连续的数据(例如,如何发现模式以及查询的标准还不知道) 。

这个问题

我有一个电子表格,每一行代表一个“网站查询”。 有一个date时间专栏,我想发现这些数据中的模式,回答如下问题:

  • 什么是最常见的时间来接受询问
  • 接受询问的一周中最常见的一天是什么?
  • 其他有用的信息,我可以从数据中收集,以便让我瞄准可能的客户

这与您经常在社交媒体分析中看到的function类似,比如“推特最佳时间”。

我明白,计算一周中最常见的一天是非常简单的,因为天是谨慎的对象。 所以我不需要帮助!

我想避免把这一天分成四个任意时间段(例如早餐,午餐,晚餐,夜间),并计算落入这些界限的行数。 如果这些时间段不是最好用来分割数据呢?

除了使用任意边界来量化数据之外,还有其他的方法吗?

你可以使用聚类来找出最常见的情况。 基本上,你比较查询的时间分离和聚类他们就像离散一维数字集合使用,例如,平均联动聚类标准。 当你达到相当小的数量的集群,你会开始看到一天中最主要的时间(如果你想评估这些时间,你可以把时间值作为最大集群的加权中心)。