嗨,我是一个Python新手,并试图从Excel文件的值到Python数组。 (使用python 3.6) 我确实喜欢下面的代码, file_location = "170515_data.xlsx" workbook = xlrd.open_workbook(file_location) sheet = workbook.sheet_by_name('Sheet1') x = [] for rownum in range(1, sheet.nrows): x.append(sheet.cell(rownum, 1)) 和输出给我喜欢 [number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, number:380.0, […]
我有~300 .xls文件,我需要导入到Python。 我已经尝试过xlrd和pandas read_excel,并且都以“不支持的格式或损坏的文件:期望的BOFlogging;发现='XS1351'”导入失败。 每张纸上大约一半的栏目都有引号,并且等号=“THISFORMAT” 另一半没有引号或特殊字符。 任何帮助深表感谢
我已经弄清楚如何使用For循环打印Excel电子表格中的数据,但是我知道我想将每列作为不同的variables导出,以便我可以操纵它们,例如使用plot.ly绘制graphics 我到目前为止所使用的是; import xlrd book = xlrd.open_workbook('filelocation/file.xlsx') sheet = book.sheet_by_index(0) for j in range(1,4): for i in range(2,8785): print "%d" %sheet.cell_value(i,j) 这只是从电子表格打印到我的terminal,这是没有用的所有数字。 但是我想要这样的东西; import xlrd book = xlrd.open_workbook('filelocation/file.xlsx') sheet = book.sheet_by_index(0) for j= 1: for i in range(2,8785): Time= "%s" %sheet.cell_value(i,j) for j= 2: for i in range(2,8785): SYS= "%s" %sheet.cell_value(i,j) 这将为每列声明不同的variables。 但据我所知,从错误信息我似乎使用For循环错误,我不熟悉For循环在Python中,我只有真正在Matlab中使用它们。 *编辑*固定缩进的问题,在原来的代码罚款,而不是错误的来源。
当我尝试pd.read_excel()时出现以下错误。 这个错误是特定于我的电脑的:当我在不同的计算机上使用相同的文件运行脚本时,不会发生错误。 Python 3.6.1的Anaconda发行版。 pandas版本'0.20.3' ,Xlrd版本'1.1.0' : XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\x08jstanle' XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\x08jstanle'是我的电脑名称,所以这可能是一个很大的暗示,我错过了。 它试图打开.xls或.xlsx文件。 我试过改变扩展到旧的和新版本的Excel没有任何改变。 谢谢您的帮助! 我会把下面的完整错误的位。 C:\Users\jstanley\Documents\—-\—\Python\load_data_original.py in load_(exp_id, file_path) 60 61 def load_(exp_id, file_path): —> 62 dict_sheets = pd.read_excel(file_path, header=None, sheetname=None) 63 new_dict_sheets = dict() 64 C:\Users\jstanley\Anaconda3\lib\site-packages\pandas\io\excel.py […]
我真的很努力阅读一个Python中的excel文件,这是我需要能够做的课程,我已经设置,我已经find了一个使用xlrd做的方法,但是,我不能得到它的工作。 我用cmd来安装xlrd(pip install xlrd),但是成功,但是我仍然无法读取Excel工作表到Python,我不确定为什么它不工作,下面是我的代码: import xlrd file_location = "C:/Users/Sean/Desktop/DADSA 17-18 COURSEWORK A MALE PLAYERS.csv" workbook = xlrd.open_workbook(file_location) 现在,我看过这个方法的每个教程都起作用了,但是当我尝试这样做时,我得到一个错误: "Traceback (most recent call last): File "C:\Users\Sean\Desktop\Data Structures Assignment 1\Tennis.py", line 3, in <module> workbook = xlrd.open_workbook(file_location) File "C:\Users\Sean\lib\site-packages\xlrd\__init__.py", line 162, in open_workbook ragged_rows=ragged_rows, File "C:\Users\Sean\lib\site-packages\xlrd\book.py", line 91, in open_workbook_xls biff_version = bk.getbof(XL_WORKBOOK_GLOBALS) File "C:\Users\Sean\lib\site-packages\xlrd\book.py", line 1271, […]
相当简单; 我从Excel文件中获得了我想要的数据,但似乎无法在XLRD自述文件中find任何解释如何解决此问题的内容: xldate:40397.007905092592 number:10000.0 text:u'No' number:0.1203 number:0.096000000000000002 number:0.126 到他们各自的python数据types。 有任何想法吗?
我正在尝试编写一个脚本,用于将员工时间表从多个文件复制/粘贴到一个编译文件。 由于他们是带有项目代码的时间表,因此当天员工在其他项目上工作时,某些单元格会留空。 此外,文件已经从xlsx(2007)转换为.csv.xls,这似乎打开xlrd就好了。 我知道如何打开和创build一个图书对象,但是我对这个模块的知识是非常有限的,所以我想也许一个通用algorithm会有帮助: import xlrd, xlwt put all following in for or while loop to iterate through files: book = xlrd.open_workbook('mybook.csv.xls') extract data; store data for ouput use for loop to iterate over data, output to final sheet open next file, repeat process storing each output below the previous 我正在寻找任何有助于我find答案的东西,而不仅仅是代码。 任何帮助,将不胜感激。 谢谢。
我有一个Excel数据集: "id","value","name" 1 , 10, "cat" 2 , 20, "fish" 在Python中: import xlrd col1 = "id" col2 = "value" col3 = "name" wb = xlrd.open_workbook("file.xls") sh = wb.sheet_by_index(0) result = sh.someMethod((col1,col3))????? 有没有一种方法可以按名称返回列? print result [[1,"cat"],[2,"fish"]]
在我过去的问题中,我已经说过我是python的新手了。 我只用了一次工作。 再一次,我还有一个小小的工作要做。 我必须读取一个excel文件,并在该excel文件中,有3列(col1,col2,col3)。 大约有100行。 col1有2个值A和B. col2的值范围从1 – 10。col3,有很多不同的值。 但是我希望我的python程序查看col1中每个不同的值,然后查看col2中每个不同的值,然后计算col3的所有相应值的平均值。 希望输出结果如下所示: A – 1 = 2.3 A – 2 = 6.2 A – 3 = 5.7 etc. etc. B – 1 = 3.5 B – 2 = 4.1 B – 3 = 8.1 etc. etc. 我知道,要问很多,但我已经做到了这一点: import xlrd #import package #opening workbook and reading first […]
我正在尝试编写一个从Excel文件读取的脚本作为模板,然后根据从.txt文件读取的内容插入新的数据。 我正在使用xlrd模块进行阅读。 目前,我被困在脚本的阅读部分。 我打算每次将colx和colx参数variables加1,以便在Excel文件中search每个单元格。 但是,似乎Python的参数variables不能被修改? 我的脚本增量修改外部variables。 有没有办法实现逐个单元格的值search? # Define variables switch1 = 1 count = 0 rowx = 0 colx = 0 # Loop while switch1 == 1 and count < totalCells: print "AAAA" cellValue = "Long string in here….." if sh.cell_value(rowx=0, colx=0) == cellValue: print "BBBB" switch1 = 0 rowx += 1 colx += […]