如何从xlsx文件中读取并将特定的列值存储到Python中的数组?

你好社区我想弄清楚如何从一个xlsx文件读取数据并将其存储到一个数组中。 什么是最好的图书馆,我可以下载来做到这一点python27?

我想弄清楚如何我可以读取一个特定的列,从列中获取值到一个特定的单元格,然后将其存储到一个数组?

例如:对于我的线性回归分析,我有一个Yvariables和一个多variablesX方程。

Y值将从特定列中读取

例如:

y= [1,2,3,4,3,4,5,4,5,5,4,5,4,5,4,5,6,5,4,5,4,3,4] #<-specific column 

其中多variablesX值将从多列中读取数据值

例如:

  x = [ [4,2,3,4,5,4,5,6,7,4,8,9,8,8,6,6,5,5,5,5,5,5,5], #<-specific column [4,1,2,3,4,5,6,7,5,8,7,8,7,8,7,8,7,7,7,7,7,6,5], #<-specific column [4,1,2,5,6,7,8,9,7,8,7,8,7,7,7,7,7,7,6,6,4,4,4] #<-specific column ] 

谢谢

pandas对于这种types的操作非常有用。

 import pandas as pd xl_workbook = pd.ExcelFile("my_data.xlsx") # Load the excel workbook df = xl_workbook.parse("Sheet 1") # Parse the sheet into a dataframe x1_list = df['x1'].tolist() # Cast the desired column into a python list 

具体来说,当您通过列索引调用df时,它将返回一个Numpy序列,而.tolist()将它强制转换为一个python列表。

您可以使用openpyxl,并在其文档中find所有需要的信息

另一个选项是Win32Com 。 我用Python 2.7来处理Excel和Word文件。