如何使用python将excel数据读取到数组中
在我工作的实验室里,我们处理了96孔读板机产生的大量数据。 我试图通过编写一个脚本来加速这个过程,该脚本将根据光吸收(简单部分:)计算细胞毒性百分比,并使用matplotlib输出条形图。
问题是平板阅读器将数据输出到.xls文件中。 我了解像pandas这样的模块有一个read_excel函数,你能解释一下如何读取excel文件并将其放入数据框?
谢谢
24孔板的数据样品(为简单起见):
0.0868 0.0910 0.0912 0.0929 0.1082 0.1350 0.0466 0.0499 0.0367 0.0445 0.0480 0.0615 0.6998 0.8476 0.9605 0.0429 1.1092 0.0644 0.0970 0.0931 0.1090 0.1002 0.1265 0.1455
我不确定你说的数组是什么意思,但是如果你的意思是一个matrix,你可能会在寻找:
import pandas as pd df = pd.read_excel([path here]) df.as_matrix()
这将返回一个numpy.ndarraytypes。
这个任务在pandas这些天是非常容易的。
import pandas
df = pandas.read_excel('file_name_here.xlsx', sheet_name='Sheet1')
这里有一个很棒的xlrd
包,里面有快速xlrd
示例。 你可以只是谷歌它find代码片段。 我从来没有使用过panda
的read_excel
函数,但是xlrd
覆盖了我所有的需求,并且可以提供更多,我相信。
你也可以用我的包装库来试用它,它也使用xlrd:
import pyexcel as pe # pip install pyexcel import pyexcel.ext.xls # pip install pyexcel-xls your_matrix = pe.get_array(file_name=path_here) # done