尝试使用Python或Excel连接.asc文件和.asc文件

家伙。

我有一个独特的问题试图合并两个大数据文件在一起。 这两个文件都有一列相同的数据(专利号),其他所有列都不相同。

这个想法是join他们,这样这些专利号码列alignment,使其他数据可读和连接。

只是.dat文件的前几行看起来像:

IL 1 Chicago 10030271 0 3930271 PA 1 Bedford 10156902 0 3930272 MO 1 St. Louis 10112031 0 3930273 IL 1 Chicago 10030276 0 3930276 

.asc

 02 US corporation No change 11151713 TRANSCO PROD INC 58419 02 US corporation No change 11151720 SECURE TELECOM INC 502530 02 US corporation No change 11151725 SOA SYSTEMS INC 520365 02 US corporation No change 11151738 REVTEK INC 473150 

.dat文件太大,无法在Excel中完全打开,所以我不认为重新组织它有一个选项(而不知道是否通过我在网上find的任何macros)。

一个新手问题,我觉得,但没有人知道我怎么可以连接这些数据集(最好使用Python)与这个专利号码唯一标识符?

您需要编写一个程序,从您想要合并的两个文件中读取数据。 您将打开文件并parsing每行的数据。 从那里你可以把数据写到一个新的文件中。 这是通过python文件IO完成的。

伪代码:

 def filehandler(self, filename1, filename2): Fd =open(filename1, "r") Fd2 = open(filename2, "r") while True: line1 = Fd.readline() if not line1: break # this will exit the loop if there is no more to read Line1_array = line1.split() # first line of first file is split and saved in an array deliniated by spaces.