开始使用python处理数据

我有一个约300万细胞的Excel电子表格。 我问了下面的问题,我喜欢关于将电子表格保存为CSV,然后用python处理它的答案:

解决scheme对300万个数据点进行大量计算并制作图表

  1. 有没有一个图书馆,我可以使用将阅读csv成matrix,或者我应该写一个自己?
  2. python会说VBA吗?
  3. 在我完成数据处理之后,是否可以简单地将它放回CSV格式,以便我可以在Excel中打开它进行查看?

有没有一个图书馆,我可以使用将阅读csv成matrix,或者我应该写一个自己?

csv模块处理几乎所有你想要的东西。

python会说VBA吗?

铁蟒可能。

在完成数据处理之后,是否可以简单地将它放回CSV格式,以便我可以在Excel中打开它进行查看?

csv模块处理几乎所有你想要的东西。

build议:阅读: http : //docs.python.org/library/csv.html

我喜欢NumPy的这种东西的loadtxt 。 非常可configuration为读取CSV。 savetxt在操作后放回去。 或者你可以检查出内置的csv模块,如果你不想安装任何新的东西。

如果我们说pythonish,为什么不使用http://www.python-excel.org/

读取文件示例:

 import xlrd rb = xlrd.open_workbook('file.xls',formatting_info=True) sheet = rb.sheet_by_index(0) for rownum in range(sheet.nrows): row = sheet.row_values(rownum) for c_el in row: print c_el 

编写新文件:

 import xlwt from datetime import datetime font0 = xlwt.Font() font0.name = 'Times New Roman' font0.colour_index = 2 font0.bold = True style0 = xlwt.XFStyle() style0.font = font0 style1 = xlwt.XFStyle() style1.num_format_str = 'D-MMM-YY' wb = xlwt.Workbook() ws = wb.add_sheet('A Test Sheet') ws.write(0, 0, 'Test', style0) ws.write(1, 0, datetime.now(), style1) ws.write(2, 0, 1) ws.write(2, 1, 1) ws.write(2, 2, xlwt.Formula("A3+B3")) wb.save('example.xls') 

页面上还有其他的例子。

如果你不想处理从CSV中来回变化,你可以使用win32com,它可以在这里下载。 http://python.net/crew/mhammond/win32/Downloads.html