文本挖掘 – 挖掘描述性Excel表格数据的最佳方法是什么?

我从excel表中的数据库中取得大学的安置数据。 我需要把我公司提供的工作描述(这是对所有行的描述性字段)进行文本挖掘,然后提出对需求描述文件的分析。 这里是数据的快照 在这里输入图像说明

任何人都可以帮我启动这个活动吗?

谢谢Saurabh

我不是数据专家,但我有一些数据挖掘经验。 我会尝试以下步骤为初学者:

  1. Excel不适合这样的分析。 find一些专用于数据挖掘的工具,例如RStudio。 R有许多有用的数据挖掘algorithm。

  2. 清除数据,例如所有的文本小写,删除停用词,删除标点符号,删除额外的空格。

  3. 标记数据,例如1个词语标记 – “财务”,“学士”

  4. 决定如果某个configuration文件需求与否,您将如何维护? 如果通过configuration文件,你的意思是你需要更频繁地出现在数据中的某些令牌的频率信息,然后其他人,如“金融”,“学士”等,然后简单地创build一个频率matrix。 R允许你创build一个可视化的这个词云。

这是开始你:)。 我相信在这个问题上还有很多需要提出的build议。