通过电子表格值计算最常见的时间

初步

这个问题适用于任何电子表格系统。我希望能够帮助解决问题，而不是回答问题。（虽然后者将是最有用的。）

我理解堆栈溢出对于特定的编程问题是有好处的，而且我知道这可能需要我几次尝试才能正确地得到我的问题，所以请通过提供build议来帮助我澄清我的问题，并将对其进行更新。

像许多数据新手一样，我对于谨慎的数据（例如上个月有多less个查询）有很好的经验，但是我很难理解如何处理连续的数据（例如，如何发现模式以及查询的标准还不知道）。

这个问题

我有一个电子表格，每一行代表一个“网站查询”。有一个date时间专栏，我想发现这些数据中的模式，回答如下问题：

这与您经常在社交媒体分析中看到的function类似，比如“推特最佳时间”。

我明白，计算一周中最常见的一天是非常简单的，因为天是谨慎的对象。所以我不需要帮助！

我想避免把这一天分成四个任意时间段（例如早餐，午餐，晚餐，夜间），并计算落入这些界限的行数。如果这些时间段不是最好用来分割数据呢？

除了使用任意边界来量化数据之外，还有其他的方法吗？

你可以使用聚类来找出最常见的情况。基本上，你比较查询的时间分离和聚类他们就像离散一维数字集合使用，例如，平均联动聚类标准。当你达到相当小的数量的集群，你会开始看到一天中最主要的时间（如果你想评估这些时间，你可以把时间值作为最大集群的加权中心）。