Tag: python

用python / xlrd比较两张单独表格的excel数据

我有两个列表是从两个独立的Excel工作簿中提取的。 每个元素包含两个自己的元素。 这些列表表示在每个Excel工作簿的前两列中find的数据。 例如: search_terms = [['term1',300],['term2',400],['term3',200]…] #words searched on our website with number of hits for each item_description = [[900001,'a string with term1'],[900002,'a string with term 2'],[900003,'a string with term 1 and 2']…] #item numbers with matching descriptions 我的目标是将search_terms中的string与item_descriptions中的string进行比较,并针对每个search词从item_description中编译匹配项目编号的列表。 然后,我想根据他们产生的命中数量来排列前250位的术语和匹配的项目编号。 我从xlrd生成了两个列表,我想我想转换为元组,并工作生成类似于以下的列表: results = [['term1',300,900001,900003],['term2',400,900002,900003],['term3',200]] #search term, number of hits, and matching item numbers based […]

Python组合2个XLSX文件

我有两个我需要结合的XLSX文件。 他们都是Excel 2010文件(.xlsx),我所读的是空间分隔(我打开纠正)。 这两个文件将有相同的行数,行将排队; 例如row1,file1将对应于row1,file 2等…这些文件有很长的字段,所以我只是为了简单地显示模拟数据。 第一个文件的格式为: a 123 20 20141201 b 456 50 20141130 ….. 第二个文件的格式是: 20141201 20141130 … 所以我想输出是: a 123 20 20141201 20141201 b 456 50 20141130 20141130 … 我的代码在下面,但是似乎有两个问题: 首先,array3的输出格式不正确: 'a 123 20 20141201 \t\r\n', '20141201\n', 'b 456 50 20141130 \t\r\n', '20141130\n', …. 我怎样才能正确地连接这些以确保其他date戳在选项卡,换行符等之前…(\ t \ r \ n)? 其次,当我写这个数组到输出文件的行是不一致的: 第一行有1列中的所有内容(注意☺=白色方形符号,不知道它为什么会出现笑脸?): […]

TypeError:write()至多需要5个参数(给出6个)Python Excel

我需要input这个参数。 但python不让我input超过5.有没有办法? sheet.write(26, 0, "Index", center, bold, timeFormat)

为什么只有在xlwings中执行代码后才能更新checkbox?

我有一个分配给button和checkbox的macros的xslm文件。 按下这个button,运行一个python脚本的macros,并将数据插入到一个表单中。 问题是,在macros中我禁用了checkbox,但它不影响checkbox,直到macros完成。 下面是一个macros的例子: def insert_data(): wb = Workbook.caller() wb.xl_workbook.ActiveSheet.OLEObjects("Checkbox1").Object.Enabled = False data = pd.read_csv("data.csv") Range("A1").value = data

在python中更改xlsxwriter中的x轴

我想了解如何在x轴上使用最小值和最大值。 我能够在Y轴上做到这一点,但无法弄清楚如何在X轴上做到这一点。 我正在用这个例子来testing它,在那里也不工作。 任何帮助或build议将不胜感激。 以下是我正在使用的代码。 您可以看到y轴使用min调用,但x轴不使用 import xlsxwriter workbook = xlsxwriter.Workbook('chart_line.xlsx') worksheet = workbook.add_worksheet() bold = workbook.add_format({'bold': 1}) # Add the worksheet data that the charts will refer to. headings = ['Number', 'Batch 1', 'Batch 2'] data = [ [2, 3, 4, 5, 6, 7], [10, 40, 50, 20, 10, 50], [30, 60, 70, 50, […]

我如何在Python中使用lowecase文件path?

我有一个macros,它应该是一个文件的单元格的值,然后使用xlwings和VBS脚本将其转换为一个csv文件。 这个macros被分配给一个button。 下面是一个示例函数: import subprocess from xlwings import Workbook, Range def extract_excel_sheet_to_csv(filename, sheet_name, working_dir, csv_filename): wb = Workbook.caller() new_filename = os.path.join(working_dir, filename) cmd = ''.join(['cscript extract_excel_sheet_to_csv.vbs "', new_filename, '" "', sheet_name, '" "', working_dir, '" "', csv_filename, '"']) cmd = cmd.encode("utf8") subprocess.call(cmd) filename = Range(sheet_arxikh, status_cell).value # Example data.xlsb sheet_name = u"Αρχείο" working_dir = os.path.dirname(wb.fullname) […]

OpenPyXl删除负载公式

我正在尝试使用OpenPyXL 打开一个.xlsx文件 读一个我知道包含一个数字的单元格 写一个不同的号码给那个单元格 将结果保存到相同或不同的.xlsx文件中 但是,即使我只执行第一个和最后一个步骤,生成的.xlsx文件也将删除所有的公式。 我的代码最简单的版本是这样的: from openpyxl import load_workbook wb = load_workbook(filename=file_path, data_only=False, guess_types=False) wb.save(file_path_new) 但即使没有改变任何东西,我仍然失去了所有的公式。 我已经尝试了不同的选项值。 我最大的问题是,只有在昨天,完整的代码(包括读写数字单元格)正在工作,保存的结果在该单元格中有新的编号(当在Excel中查看时)。 我从1.8.5更新到2.0.2,但不记得这是在原代码的工作之前还是之后。

在excel vba中调用macros后不能释放内存

我一直在这里四处查看其他问题,但无法find我的主题的解决scheme。 我注意到,每次我调用Excel中的VBA中的macros,实际上通过Microsoft脚本控制运行一些Python代码,macros使用的内存不释放,虽然我设法将例程内使用的所有内容设置为Nothing(和最终调用Python脚本中的垃圾收集器)。 代码如下: Sub save_rt() Dim lc As MSScriptControl.ScriptControl Set lc = New MSScriptControl.ScriptControl lc.Language = "python" lc.Timeout = 50000 'in sec workingdir = Range("xmldir").Cells.Value lc.ExecuteStatement ("import pandas as pd") lc.ExecuteStatement ("import numpy as np") lc.ExecuteStatement ("import gc") myvalues = Range("icap_cf_values").Cells n_righe = UBound(myvalues) n_colonne = UBound(myvalues, 2) lc.ExecuteStatement ("myvalues = []") For i = […]

从不同的工作表名称的Excel工作表中刮擦数据

我有许多excel电子表格与他们的数据。 我想find所有的Excel电子表格,去一个特定的工作表,并find一个特定的单元格。 每张电子表格对应于一名患者,其中一张工作表具有患者在特定细胞中接受的剂量。 然后,我可以绘制每张电子表格的价值随时间变化的情况。 但是,在一些工作簿中,工作表被称为不同的东西,或者处于不同的索引值。 是否有任何解决scheme,不涉及我手动重命名/移动1000+电子表格工作表我有,所以他们都在相同的格式? 这是我有的代码,如果他们都在工作表索引5。 #finds all excel files import os path = 'C:\Users\malonc01\Desktop\QC' files = os.listdir(path) files_txt = [i for i in files if i.endswith('.xlsx')] print files_txt # Gets data from excel files: import xlrd Data = [] Time = [] for i in files_txt: workbook = xlrd.open_workbook(str(path) + "\\" + str(i)) […]

在string中查找重复

我已经交了一个项目,我需要从数据集中的多行中find重复的配对。 虽然数据集大得多,但主要部分是围绕培训date,培训地点和培训人员的名字。 所以每行数据都有一个date,一个位置,然后是逗号分隔的名字列表: Date Location Names 1/13/2014 Seattle A, B, D 1/16/2014 Dallas C, D, E 1/20/2014 New York A, D 1/23/2014 Dallas C, E 1/27/2014 Seattle B, D 1/30/2014 Houston C, A, F 2/3/2014 Washington DC D, A, F 2/6/2014 Phoenix B, E 2/10/2014 Seattle C, B 2/13/2014 Miami A, B, E 2/17/2014 Miami […]