Tag: python

导出特定工作表,并保存不同的文件openpyxl

我试图从Excel文件中导出特定工作表,但没有结果。 我想将一张特定的纸张输出到一个全新的文件我写的是: import openpyxl book = openpyxl.load_workbook('C:\Python\test.xlsx') a = (book.get_sheet_names()) sheet1 = book[a[5]] sheet1.save('C:\Python\sheet2.xlsx') 另外,我不能做的另一件事,如果我有它的名字,找一张表。 我很抱歉,如果问题很简单,但是从我开始使用Python已经过去了几天:)

XLRD错误通过pandas

当我尝试pd.read_excel()时出现以下错误。 这个错误是特定于我的电脑的:当我在不同的计算机上使用相同的文件运行脚本时,不会发生错误。 Python 3.6.1的Anaconda发行版。 pandas版本'0.20.3' ,Xlrd版本'1.1.0' : XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\x08jstanle' XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\x08jstanle'是我的电脑名称,所以这可能是一个很大的暗示,我错过了。 它试图打开.xls或.xlsx文件。 我试过改变扩展到旧的和新版本的Excel没有任何改变。 谢谢您的帮助! 我会把下面的完整错误的位。 C:\Users\jstanley\Documents\—-\—\Python\load_data_original.py in load_(exp_id, file_path) 60 61 def load_(exp_id, file_path): —> 62 dict_sheets = pd.read_excel(file_path, header=None, sheetname=None) 63 new_dict_sheets = dict() 64 C:\Users\jstanley\Anaconda3\lib\site-packages\pandas\io\excel.py […]

如何将dict添加到python中的csv文件和excel文件中

我有Python的字典,我想追加到CSV文件和Excel文件。 我有一个函数返回下面的字典 d = {'Engine': u'2.0 TSI MLB', 'Category': 'Category', 'Installation': 'Installation', 'Features': 'Features', 'Title': 'Title', 'Recommended Software': 'Recommended Software', 'UniCONNECT+': 'UniCONNECT+', 'Make': u'AUDI', 'Price': 'Price', 'Stock Power': 'Stock Power', 'Desctiption': 'Description', 'Related Hardware': 'Related Hardware', 'Year': u'2018', 'Hardware Included': 'Hardware Included', 'Model': u'A4', 'Product Type': 'Product Type', 'LB-FT': 'LB-FT', 'HP': 'HP', 'Octane': 'Octane', 'Media1': […]

openPyXL – 在取消合并期间将值赋给单元格范围

所以我有excel文件,每个文件有几张,我正在处理脚本,它将从选定的表格收集数据,如果它们存在于文件中,并将它合并成一个大的表格。 一般来说,它正在工作,迭代通过文件,如果需要的工作表存在,它发现数据单元格的范围,并将其附加到数据框。 我现在需要做的事情是将标题行(列名称)添加到Dataframe,但在表单中是多行标题。 为了使它看起来在数据框中相同,我需要在顶部标题行中取消合并单元格,并将第一个单元格的值复制到先前合并的范围中的其余部分。 我使用OpenPyXL来访问Excel表。 我的function只接受表单作为参数。 它看起来像这样: def checkForMergedCells(sheet): merged = ws.merged_cell_ranges for mergedCell in merged: mc_start, mc_stop = str(mergedCell).split(':') cp_value = sheet[mc_start] sheet.unmerge_cells(mergedCell) cell_range = sheet[mergedCell] for cell in cell_range: cell.value = cp_value 事情是,cell_range返回一个元组,最终得到错误消息: AttributeError:“元组”对象没有属性“值”下面你可以看到debugging过程中的screencap显示了在每个variables中传递的值。 debugging器正在运行

使用pandas基于COUNTIF()的单独的Excel表build立一个二维表

我想build立一个基于值(和countifs)从另一个表的二维表。 我设法成功地使用Excel原型,但是我坚持两个概念: 1. Emulating Excel COUNTIF() on pandas 2. Dynamically build a new dataframe 注意:COUNTIF()将范围和标准作为参数。 例如,如果我有一个颜色列表,我想知道下面的列表中的“橙色”的次数: A Red Orange Blue Orange Black ,那么我会简单地使用下面的公式: COUNTIF(A1:A5, "Orange") 这应该返回2。 当然,COUNTIF()函数可以变得更加复杂,比如COUNTIF(range1,criterion1,range2,criterion2 …)这种forms的表单连接条件可以被解释为一个AND标准。 例如,如果我想在类似于下面的列表中计算35岁以上的女性: AB Female 19 Female 40 Male 45 ,那么我会简单地使用下面的公式: COUNTIF(A1:A3, "Female", B1:B3, ">35" 这应该返回1。 回到我的用例。 这是源表: Product No Opening Date Closing Date Opening Month Closing Month 0 […]

拉和治疗NHL数据来处理它在Excel中

我有一个朋友想以一种可以直接在Excel中处理的方式从API中提取NHL数据。 事实上,他在Excel方面有着非常丰富的经验,并且希望能够对此做出预测。 我想创build一个小的Web应用程序,以便他可以直接从界面提出请求。 https://www.quora.com/Is-there-any-JSON-API-available-for-getting-NHL-information-rosters-lineups-statistics-etc 问题 : 如果我把一个.csv文件中的NHL数据拉出来,他能从Excel文件中处理信息吗? 假设我完成了这个Web应用程序,并且不再支持使用的API。 我将需要更改API并重构整个代码,以便与新代码一起工作。 有没有我可以用来避免这种问题的包装? 我遇到的一类问题是必须重新格式化“拉取文件”,以便它可以与我的应用程序一起工作。

查找不在一组值中的行(与SQL Except类似)

我想要做的是删除Excel文件的几行(与pandas),然后将文件没有这些行保存到.xlsx(与pyexcelerate模块)。 我知道我可以删除数据框的行(我已经得到这个工作)。 但是我已经阅读了几篇文章,当有很多(在我的情况下> 5000)行应该被删除,只是从数据框中获得“删除”行的索引,然后切片dataframe就像例如SQL Except语句那样)。 不幸的是我不能得到它的工作,即使我已经尝试了几种方法。 这里是我的“源文章”: 通过不在列表中的标签切片pandas数据框 – 从用户ASGM答复 如何从pandas数据框中删除行列表? – 用户Dennis Golomazov的回答 这里是函数的一部分,它应该删除行并保存创build的文件: for index, cell in enumerate(wb_in[header_xlsx]): if str(cell) in delete_set: set_to_delete.append(index) print str(cell) + " deleted from set: " + str(len(set_to_delete)) wb_out = Workbook() data_out = wb_in.loc[set(wb_in.index) – set(set_to_delete)] ws_out = wb_out.new_sheet('Main', data=data_out) wb_out.save(file_path + filename + "_2.xlsx") 这里是一个数据框的例子: sku product_group […]

保存date时间单元格后,pandas不会读取excel文件

我正在用pandas read_excel读取一个文件 df0 = pd.read_excel(cfname,'Calendari', index_col=0, parse_cols='A:R', converters={'Categoria':str,'Fase':str, 'Grupo':str, 'Jornada':str, 'Partido':str, 'IdPartido':str,'Leido':str}) df0.head() 输出是: Linea Categoria Fase Grupo Jornada Partido IdPartido Leido Data Hora 2 CCM 1 1 1 -1 NaN No Jornada 1 NaN 3 CCM 1 1 1 0 NaN No Data Hora 4 CCM 1 1 1 1 CCM110101 No 2017-09-30 00:00:00 […]

从Google表格中的REST服务导入数据

我只想从Google表格中的其他url获取一行。 当我尝试 =IMPORTDATA("https://imageryuploader.geoplatform.gov/arcgis/rest/services/ImageEvents/MapServer/1/query?text=A0016-4646&outFields=EXIFPhotoDate") 我得到了页面的整个代码块 我得到NA =IMPORTHTML("https://imageryuploader.geoplatform.gov/arcgis/rest/services/ImageEvents/MapServer/1/query?text=A0016-4646&outFields=EXIFPhotoDate", "list",1) 如果我只是把https://imageryuploader.geoplatform.gov/arcgis/rest/services/ImageEvents/MapServer/1/query?text=A0016-4646&outFields=EXIFPhotoDate放到浏览器中, logging:2 EXIFPhotoDate:1506173228000 Point:X:-66.61147999999997 Y:18.279028333000042 EXIFPhotoDate:1506173228000 Point:X:-66.61147999999997 Y:18.279028333000042 我想创build一个谷歌表,我们有 列A – 图像名称,在列B中使用= IMPORTHTML(“ https://imageryuploader.geoplatform.gov/arcgis/rest/services/ImageEvents/MapServer/1/query?text=A0016-4646&outFields=EXIFPhotoDate ”, “list”,1)或类似的东西,得到UNIX D / T。 最后,在C列中应该inputdd / mm / yyyy和24 UTC时间。 感谢将Exifdate转换为不同的格式我有转换unix d / t的公式。 如果Google表格无法做到这一点,那么很高兴使用EXCEL或Python 2.7 示例GSheet位于https://docs.google.com/spreadsheets/d/1Ff-gohRIkumpxqSeEVKyGq6PPEP542PJSB1vBIzI1jA/edit#gid=0

用pandasparsingExcel数据 – 为什么在重命名列时跳过了列?

我真的很希望它的东西简单地失踪。 我正在阅读使用Pythonpandas的Excel工作簿。 当我将我的列重命名为数字1:len(列)时,它会跳过前几列。 如果单元格中没有值,似乎只能跳过它们。 即使列没有一个值,我仍然希望它数1,2,3 … xl = pd.ExcelFile('Excel.xlsm') df = xl.parse('Worksheet1') df.columns = [str(x) for x in range(0,df.shape[1])] 我希望有人能指出我正确的方向。 我曾尝试使用标题跳过前几列,但没有给我一个一致的和可靠的结果。 谢谢!