可search的文件

我只是负责我们部门的文件。 现在是一团糟(300+)。 我们拥有自2006年以来使用Microsoft Office(MSWord,Excel和Access)创build的每个内部工具的文档,并使用Excel和Word制作。 这些文档可以保存程序员的用户操作信息,技术信息或VBA / SQL信息。 我的挑战是将所有这些文件放在一起,并能够search所有这些文件的特定字。 就像我想要search一个表名一样,我会input“tblSomething”,然后我将得到所有具有该特定单词的文档的结果和/或甚至是哪个工具正在使用该表的列表的结果。

所以基本上我正在寻找某种文件pipe理器。 如果需要,我不必介意将这些文档重做/复制/粘贴到其他文档中。

我准备好看看免费的东西或付费的东西。 有什么build议么? 谢谢。

我认为你的问题的一个好办法是规范化你的数据源,并将其索引到可search的数据库中。

您可能需要首先从现有文档创build存储库。 创build基于文本的文档库的一个简单方法是使用像Lucene这样的工具来索引所有的文档文本。

如果你正在构build你自己的索引器,这可能涉及到一些编程。