跟踪版本控制中的Excel文件

我们正在超越开发团队,并试图让公司内的其他团体对需要更改跟踪的重要文档使用版本控制。 一个频繁的需求是Excel电子表格。 这些都是大型电子表格,经常修改(每周或每月),但每次只更改一小部分单元格。

只要将文件粘贴到Subversion (我们正在使用的特定工具)中,就会给出更改的历史logging并保留旧版本。 而TortoiseSVN客户端使得非技术用户很容易。 最新版本的TortoiseSVN甚至包含一个脚本 ,可以用来在Excel文档之间执行很好的视觉差异。

我剩下的问题是磁盘空间。 这些是大文件。 版本之间的差异很小,但我担心版本控制会注意到该文件是二进制的,并退回到单独存储每个版本。 有谁知道这个解决scheme? 例如,我们可以保存一个格式,其中差异将会很小,因此只会保存差异,或者是一个专门了解Excel文件的版本控制系统? 我还没有做过性能testing,但是我们的版本控制服务器已经被严重征税,如果有更好的解决scheme,我很想知道它是什么。

目前SVN无法高效地存储这些types的文件。 虽然有一些讨论

http://subversion.tigris.org/ds/viewMessage.do?dsForumId=462&dsMessageId=651443

这个SO问题显示了存储OpenXML办公文档时的图表。 结果非常线性

Subversion能否有效地存储OpenXML Office文档?

虽然你的问题不是专门关于这种格式,但它可能仍然适用。 你可能只需要在SVN中运行一个testing,看看它需要什么types的存储。 SVN在存储二进制文件方面相当不错,所以它可能不会太糟糕。 上面的SO问题还提到将文件保存为纯文本XML 2003文档,您也可以调查这些文档。

一个考虑因素是使用Team Foundation Server进行源代码pipe理(如果这是一个选项),它将只存储您的增量更改,尽pipe它可能会有点沉重,你要找的东西。

根据我的理解,二进制文本和文本不会影响SVN中的存储容量: http : //help.collab.net/index.jsp?topic=/ faq/ svnbinary.html