Tag: python

VBA到Python转换使用beautifulsoup

For Each hdiv In doc.getElementsByClassName("offset1 transport-plan location-detail well well-white margin20right") For Each child In hdiv.Children If child.tagName = "H4" Then location = child.innerText ElseIf child.tagName = "TABLE" Then If row.tagName = "TBODY" Then For Each row1 In row.Children do something If row1.tagName = "TR" Then For Each row2 In row1.Children If row2.innerText <> "" Then […]

Python:遍历工作表导出到CSV

我正在做两个工作簿的总结比较,并输出第三个。 我这样做是通过将每个工作簿(包含15个工作表的相同结构)导出到一系列csv文件,然后通过读取csv文件A及其相应命名的从第二个文件转换而来的csv文件B来进行表到表比较工作簿。 我正在使用xlrd和csv 以下是失败代码的一部分: outpath_a = os.path.join(working_directory, "out_a") # dir set earlier workbook_a_sheets = workbook_a.sheet_names() workbook_b_sheets = workbook_b.sheet_names() for a in workbook_a_sheets: out_csv = os.path.join(outpath_a, a) with open(out_csv, 'wb') as oca: cw = csv.writer(oca, dialect=csv.excel, quoting=csv.QUOTE_ALL) for rownum in xrange(a.nrows): cw.writerow(a.row_values(rownum)) 这是给我的错误: AttributeError: 'unicode' object has no attribute 'nrows' 我尝试使用unicodecsv而不是csv ( import unicodecsv as csv […]

不能通过writer.save保存excel

我尝试添加一个数据框到现有的excel文件 ,我在这个问题下阅读了一个答案: 如何写入到现有的excel文件而不覆盖数据(使用pandas)? filename = 'template.xlsx' wb_target = load_workbook(filename) writer = pd.ExcelWriter(filename, engine='openpyxl') writer.wb_target = wb_target writer.sheets = dict((ws.title, ws) for ws in wb_target.worksheets) df_selection2.to_excel(writer,sheet_name='Selection',startrow=7, startcol=6,header=False, index=False) writer.save() 但是还是有一些问题: IndexError Traceback (most recent call last) <ipython-input-3-3ca40cf2bef3> in <module>() 17 18 df_selection2.to_excel(writer,sheet_name='Selection',startrow=7, startcol=6,header=False, index=False) —> 19 writer.save() 20 21 #df_selection2.to_excel(writer,sheet_name='Selection',startrow=7, startcol=6,header=False, index=False) C:\Anaconda3\lib\site-packages\pandas\io\excel.py in save(self) 725 […]

无法使用xlrd在python中打开excel文件

我正在使用python 2.7和最新的xlrd软件包。 import xlrd xfile = xlrd.open_workbook("random_stuff.xlsx"); 上面的代码给了我一个错误,说: un(shallow)copyable object of type <type 'Element'> 并带我到一个文件名为cElementTree.py其中包含: # Wrapper module for _elementtree from _elementtree import * 什么是错误,我根本不明白。 我相当新的python。 我一个月前开始学习。 编辑:使用位置的方法: import xlrd file_location = "C:\Users\Tanmay\Documents\Visual Studio 2015\Projects\PythonApplication1\PythonApplication1\random_stuff.xlsx" xfile = xlrd.open_workbook(file_location , r) 给出以下错误: [Errno 22] invalid mode ('rb') or filename: 'C:\\Users\\Tanmay\\Documents\\Visual Studio 2015\\Projects\\PythonApplication1\\PythonApplication1\random_stuff.xlsx'

如何保存通过xlrd编辑的xls表单中的图像?

我正在使用xlrd编辑Excel工作表中的几个单元格(.xls)。 我能够保留编辑信息的单元格格式( 使用这个小黑客 )。 但是,保存文件时,文档中的所有图像都将丢失。 有没有办法让他们? 我知道xlsxwrite可以将图像插入到工作表中,但不幸的是,该文件不是.xlsx。 代码如下: from xlrd import open_workbook from xlutils.copy import copy class Writetoxls(object): def __init__(self, ip, mac, ssid, wifipass, user, password): self.ip = ip self.mac = mac self.ssid = ssid self.wifipass = wifipass self.user = user self.password = password inBook = open_workbook('data.xls', formatting_info=True) outBook = copy(inBook) def _getOutCell(outSheet, colIndex, rowIndex): […]

XML到CSV / Excel

我有一个RSS格式的XML文件 – 我通常使用PC开发人员工具将其导入到excel中。 这种幻想为我自动创build一个树,我只需将根元素拖放到电子表格,点击刷新数据和繁荣我有一个CSV或Excel文件,我可以做任何数量的事情,我可以做的原始的RSS文件。 我想跳过这个步骤擅长个人电脑等,并使用类似python的东西在我的Mac上完成工作。 问题是我不想告诉phyon树,元素等我想它找出来,给我一个CSV! – 任何指导我如何能够完成这项任务?

如何在数据库中以blob格式存储excel文件,以及在python中使用sha1algorithm

我有一个特定的目录中的Excel文件,我需要将其内容存储在我的数据库表file_logging 有列作为files_name,files_content,files_sha,files_date FILE_NAME VARCHAR2(200 BYTE), FILES_CONTENT BLOB, FILES_DATE TIMESTAMP (6), FILES_SHA VARCHAR2(400 BYTE), 我怎么能以优化的方式执行它

提高Excel任务效率的几点意见

我有一个相对较小的数据集(大约5mb),我需要下载(付费订阅),并按月sorting。 我希望有人能指出一个更有效的方法来解决这个任务。 这些数据是过去30天内计划申请的logging,而且数据信息丰富,组织得不好 – 即不提供使用types(例如住宅,商业,工业等),也不提供单位数量。 但是他们确实提供了应用程序的标题以及描述。 示例标题如下: STACKVILLE – 1680公寓/餐厅/零售单位 示例描述如下: 老年人独立生活scheme包括1100个一卧室和580个双卧室公寓,配有餐厅和酒吧零售单位一个咖啡厅20间套房停车场通道环境美化和拆除工程。 1 568平方米 目前,我正在使用Excel,这有点费时。 我有一个大约100个使用类的日益增长的名单,因为我需要确定确切的用法,我search的标题和说明。 如果标题和描述都返回相同的值,那么我可以合理地确定这是使用分类,如果没有发现它不可能是有趣的 – 虽然我不是100%肯定我的方法捕捉到我所要求的一切至。 如果他们返回不同的值,那么我必须做一些手动筛选。 我使用的公式如下: =IFERROR(INDEX(Use_Classifications!$A$1:$A$100,MATCH(TRUE,INDEX(ISNUMBER(SEARCH(Use_Classifications!$A$1:$A$100,D2)),,),0)),"Not found") 在确定了他们之后,我需要确定单位的数量,并把这个数字放在数据右边的一列中进行分析。 任何人都可以推荐一个更有效的方法来做到这一点 我目前正在学习Python,如果有帮助。 也会愿意学习几乎任何东西来加速这个,因为它非常耗时。

Python更新excel电子表格链接

我有python代码打开excel,然后保存并退出,但我努力寻找一个关键的临时步骤的正确的Python代码 – 一旦python打开我的电子表格什么是代码“编辑链接”,然后“更新值”保存之前电子表格? 请注意,这是不一样的wb.RefreshAll()我的代码与缺less临时步骤如下: import win32com.client xlapp = win32com.client.DispatchEx("Excel.Application") wb = xlapp.workbooks.open('C:/myfilepathname/test.xlsm') #what code goes here to select edit links and update them all. wb.Save() xlapp.Quit() 谢谢

使用python(或其他)从大csv文件创buildExcel数据表

在我的工作中,我们正在处理大量的房地产物业数据,这些数据集中在20万行(不断增长)的csv文件中。 这csv表包括信息,如:价格,表面积,build成年份,街道,街道,邮政编码等列。 我们正在进行的部分工作包括创build一个Excel表单,这些表单的属性可以与一组特定的对象(如表面积+/- 20%)相比较。 我想自动生成这样一个Excel列表,我正在考虑为此使用Python。 这是我想要程序要做的事情: 1)读取csv文件 2)获取所有必要的参数进行比较的Excel表格 3)使用适合这些参数的属性,从csv数据创build一个Excel工作表 4)重写抽象的参数描述(例如,如果“洗碗机”列的值为“0”,则写入“无洗碗机可用”),并将house_number列中的值附加到street_name列值 python是一个很好的方式来处理这个问题,或者你会有其他的build议吗?