从Excel到TXT – 单独的行

我正在做一个程序,我将excel文件导出到.txt文件,而且我必须将这个.txt文件导入到我的程序中。 主要目标是从每行中提取相同的部分,但问题是在.txt文件中,excel的行被制作成一个没有/ n的巨大string。 你知道在程序中是否有办法将它们分开,如果有,我该怎么办?

我正在使用的文件可以在http://we.tl/YtixI1ck6l下载,到目前为止我正在尝试类似

ppi = [] for line in read_text: prot_interaction = line[0:14] ppi.append(prot_interaction) result_ppi = [] for line in read_text: result = line[-1] result_ppi.append(result) 

但是,由于它没有被格式化,而只是在一个单一的,我没有得到任何好的结果。

以该文件为例,使用csv模块parsing它。

例:

 import csv with open('/tmp/Model_Oralome.txt', 'rU') as f: reader=csv.reader(f, delimiter="\t") for row in reader: print row[0] 

打印:

 ppi C4FQL5;Q08426 C8PB60;D2NP19 P40189;Q05655 P22712;Q9NR31 ... P05783;P02751 B5E709;D2NPK7 Q8N7J2;Q9UKZ4 

(顺便说一句,你可能会遇到的问题是,只有Mac经典操作系统的行结束符才是CR,你可以在打开文件时使用通用换行符模式修复它)

Excel正在用回车符(\ r)而不是换行符(\ n)导出文本文件。

 ppi = [] with open("Model_Oralome.txt",'r') as f: lines = f.readlines() lines = lines[0].split('\r') 

从这里你可以遍历每行的行。 由于它看起来像你想要的第一列的值:

 lines = lines[1:] for line in lines: content = line.split('\t') ppi.append(content[0])