根据数字范围自动填写大数据集

我在Excel中有一个很大的表格(150k + rows),我想根据一些初步的可用信息来填写。 我将在下面发布我目前的表格结构和期望的结果,但是作为我的项目的一个大纲:我有三个主要的数据列,根据推荐的方法,我有四个可能有用的数据。 现有数据标识了一个组的ID,他们的开始年的一列,他们的最后一年的列和一个活跃的总年份列(简单地从末年减去开始年)列。 现有的数据范围是从各个成员logging的行中派生的,但这些ID已被删除。 使用这个数据我的最终目标是find每年平均团体规模。 我有很多工具可以解决这个问题,最终会在MySQL中结束。 在此之前,我打算试图从中提取一些统计数字,但是, 目标是要逐年找出平均集团规模(以该集团成员的数量为基础) ,以便能够平均过去100年的平均规模。 我的资料如下:

| A | B | C | D | | ID | Start Year | End Year | Years Active | 1 | 101 | 1967 | 1975 | 7 | 2 | 101 | 1957 | 1965 | 7 | 3 | 125 | 1960 | 1975 | 15 | 4 | 136 | 1905 | 1908 | 3 | 5 | 222 | 1964 | 1975 | 7 | 6 | 121 | 1964 | 1975 | 7 | 7 | 102 | 1952 | 1975 | 7 | 8 | 306 | 1952 | 1975 | 7 | 9 | 306 | 1972 | 1975 | 7 | 10| 172 | 1967 | 1971 | 4 | 11| 411 | 1947 | 1951 | 4 | 12| 411 | 1946 | 1950 | 4 | 13| 411 | 1946 | 1950 | 4 | 14| 411 | 1946 | 1950 | 4 | 15| 411 | 1946 | 1950 | 4 | 16| 172 | 1945 | 1949 | 4 | 17| 172 | 1963 | 1967 | 4 | 18| 301 | 1948 | 1952 | 4 | 19| 301 | 1948 | 1952 | 4 | 20| 301 | 1972 | 1976 | 4 | 

上述表示forms是我的数据当前在Excel中的数据,最多为150,784行。 我目前的路线是,我想我需要能够爆发开始年份和结束年份之间的date,以知道哪个成员在哪一年活跃,哪些组ID。 从这个angular度来说,我知道我可以通过很长的一段时间来做一些小计,以找出我需要的东西,但是我想知道是否有人可以想到一个公式模式或者macros观模式,这样做不是一件容易的事情。 我觉得我迷失在多轴方法中,似乎需要避免每年都这样做(1899-2015年为完整的数据集)。 我希望我在盯着森林的时候错过了树,有一个明显的解决办法/方法,但任何build议或帮助,你可以提供将在所有诚意不胜感激。 提前感谢您的贡献!

也许扩大你的数据,在第一行(从E1开始于1899年)和E2等说:

 =--AND($B2<=E$1,E$1<=$C2) 

这将导致一个非常大的matrix,但可能使进一步处理相对容易。 将导致二进制输出的公式转换为值,处理时间不应该是一个问题。

在这里输入图像说明