Tag: python

如何减less大型Excel文件的访问时间?

我想用Python处理一个大型的机械testing设备数据集。 该设备的软件只允许将数据导出为Excel文件。 因此,我使用适用于小型*.xlsx文件的xlrd软件包。 我的问题是,当我想打开一个共同的数据集(3-5 MB) xlrd.open_workbook(path_wb) 访问时间约为30s到60s。 有没有更多有效的方法来访问Excel文件?

Pandas – Excel导入 – Python – Glob,如何在导入中放置stringvariables

我试图导入位于映射到我的本地Z驱动器的位置的Excel文件。 该位置包含许多文件。 我正在寻找只加载那些在标题中包含昨天的date..做到这一点我到目前为止: import glob import pandas as pd from datetime import date, timedelta yesterday = date.today() – timedelta(1) yesterday = yesterday.strftime('-%m-%d-%y') all_data = pd.DataFrame() for f in glob.glob('Z:*[yesterday]*'): df = pd.read_excel(f) all_data = all_data.append(df,ignore_index=True)` 但是,试图导入时不会调用variables“昨天”。 我知道我的语法一定是错的,因为所有文件都被调用。 如何在导入条件中包含“昨天”?

打开多个XL文件,抓取数据,然后写入pandas/输出到单个Excel文件

我是新手编程和python(使用python27),我试图编写代码来打开多个Excel文件从特定的文件夹,抓住特定的单元格值,然后输出到一个单一的Excel文件,每行代表logging文件打开。 这是我的代码,我被困在下一个过程应该是什么: import os import glob import xlrd import datetime yesterday = datetime.date.fromordinal(datetime.date.today().toordinal()-1) for root,dirs,files in os.walk(src): files = [ _ for _ in files if _.endswith('.xlsx') ] for xlsfile in files: wb = xlrd.open_workbook(os.path.join(root,xlsfile)) sht = wb.sheet_by_name('Sheet1') name = xlsfile rev = sht.cell_value(0,1) gp = sht.cell_value(1,1) sls = sht.cell_value(2,1) sp = sht.cell_value(3,1) cps = […]

如何让xlwt在py2app构build中运行

我成功地使用了xlwt在我的脚本末尾输出一个excel文件,但是当这个脚本被转换成一个独立的程序(使用py2app)时,这个excel不再被生成。 其他import软件包(Tkinter的GUI)工作正常,我找不到一个地方提出这个相同的问题。 (Mac OS 10.9.5,python 2.7.5:预安装的mac版本)(xlwt存在于/build/bdist.macosx-10.9-intel/python2.7-standalone/app/site-packages/中) 问题被隔离到一个非常小的脚本,输出一个excel文件,一个填充单元格: def export_xcl(): import xlwt wb = xlwt.Workbook()#initialize excel sheet ws = wb.add_sheet('Sheet1') text_cells=xlwt.easyxf('font: name Times New Roman') ws.write(0,0, 'jaja',text_cells) print ('voor het saven') wb.save('testx.xls') print ('na het saven') if __name__ == '__main__': export_xcl() 这个脚本在正常启动时运行完美。 可执行文件却没有。 py2app使用的setup.py文件如下: from setuptools import setup APP = ['testx.py'] DATA_FILES = [] OPTIONS = […]

反正我们可以使用python调用excel插件吗?

反正我们可以使用python调用excel插件吗? 我想调用一个用户定义的加载项,它是在Excel中使用Python程序。 我需要一个免费软件,我认为pyxll需要许可证。

如何使用汤&python从Wikipedia的表中的特定列下的内容

我需要从维基百科的表格中获取内容指向特定列下的href链接。 该页面是“ http://en.wikipedia.org/wiki/List_of_Telugu_films_of_2015 ”。 在这个页面上,有几个表格“wikitable”。 我需要列标题下的内容的链接,他们指向的每一行。 我希望将它们复制到Excel表格中。 我不知道在一个特定的列下search的确切代码,但我到这里来,我得到一个“Nonetype对象不可调用” 。 我正在使用bs4。 我想提取至less部分表格,所以我可以弄清楚我想要的标题列下的href链接,但是我以这个错误结束。 代码如下: from urllib.request import urlopen from bs4 import BeautifulSoup soup = BeautifulSoup(urlopen('http://en.wikipedia.org/wiki/List_of_Telugu_films_of_2015').read()) for row in soup('table', {'class': 'wikitable'})[1].tbody('tr'): tds = row('td') print (tds[0].string, tds[0].string) 一点指导赞赏。 有谁知道?

Win32com不调度excel,说'服务器执行失败'

我最初的脚本是: import win32com.client import os file1= r'C:\\Users\cevans\Desktop\models1\file.xlsm' def refresher(): if os.path.exists(file1): xl = win32com.client.Dispatch("Excel.Application") xl.Workbooks.Open(Filename=file1,ReadOnly=1) xl.Visible = True xl.Application.Run('Report_Tablerefresh1') xl.Workbooks(1).Close(SaveChanges=1) xl.Application.Quit() del xl refresher() 当我尝试做一个简单的excel调度时,我遇到了这个错误,奇怪的是这个脚本已经运行好几个星期了,然后这个错误popup来了。 有什么build议么? Traceback (most recent call last): File "C:/Users/cevans/PycharmProjects/RigLocatorMapPull/Pipe_StorageRefresh.py", line 17, in <module> refresher() File "C:/Users/cevans/PycharmProjects/RigLocatorMapPull/Pipe_StorageRefresh.py", l ine 10, in refresher xl = win32com.client.Dispatch("Excel.Application") File "C:\Python27\lib\site-packages\win32com\client\__init__.py", line 95, in Dispatch dispatch, […]

我如何删除空白行输出时使用python写入logging到csv而不写在csv中存在的所有logging?

我一直试图删除我的CSV文件中的logging之间的空白行使用Python而不擦除整个电子表格。 import csv, os def display(file): # this procedure displays file and returns the last ID f=csv.reader(open(file,'r')) for i in f: ID = i[0] print i return ID def newentry(file, rec): # this writes the rec to the file f=csv.writer(open(file,'a')) f.writerow(rec) #————————————– ''' this is the main program that – 1. creates the next ID […]

在Excel中匹配一个特定的string,并使用python打印这些行

我正试图打印Excel中的4列的值。 我需要匹配第四列中的特定string,然后只打印那些具有该string的行。 (例如:如果我在第二行的第四列包含“甜”,我会打印整行) 示例excel: name; number; fruit; comment test1 ;1 ; apple ; healthy test2; 2; banana ;sweet and healthy 这里row2应该打印 到目前为止,我有这个,不能得到确切的方式来匹配string。 import gzip import csv, io with gzip.open("/test.csv.gz", "r") as file: datareader = csv.reader(file) included_cols = [9, 10, 11] for row in datareader: content = list(row[i] for i in included_cols if row[i]) print content

与…一起使用读取xls文件的列表,将其复制到具有多个工作表的单个工作簿中

第一次在这里 我的总体目标是将3个不同的xls文件中的数据准确复制到一个xls工作簿中,并为每个原始xls文件添加一个工作表。 从非程序的意义上说,我想从一个新的工作簿(xls或xlsx文件)中将每个xls文件中的数据复制并粘贴到它自己的工作表中。 我一直在使用xlrd&xlwt来做到这一点,并在search的帮助下,我已经能够获得大部分的代码集。 但是,我很难理解如何使用with … open命令从每个原始xls文件读取数据并将其放在自己的工作表上。 正如你可能从我的代码块学习,我的Python技能是有限的。 谢谢! import xlwt as xlwt from os.path import join import xlrd wb = xlwt.Workbook() path = r'C:\data_path\\' xls1 = 'file1.xls' xls2 = 'file2.xls' xls3 = 'file3.xls' Sheet1 = 'file1_data' Sheet2 = 'file2_data' Sheet3 = 'file3_data' names = [Sheet1, Sheet2, Sheet3] dataset = [path + xls1, path + […]