Tag: python

如何减less大型Excel文件的访问时间？: 我想用Python处理一个大型的机械testing设备数据集。该设备的软件只允许将数据导出为Excel文件。因此，我使用适用于小型*.xlsx文件的xlrd软件包。我的问题是，当我想打开一个共同的数据集（3-5 MB） xlrd.open_workbook(path_wb) 访问时间约为30s到60s。有没有更多有效的方法来访问Excel文件？

Pandas – Excel导入 – Python – Glob，如何在导入中放置stringvariables: 我试图导入位于映射到我的本地Z驱动器的位置的Excel文件。该位置包含许多文件。我正在寻找只加载那些在标题中包含昨天的date..做到这一点我到目前为止： import glob import pandas as pd from datetime import date, timedelta yesterday = date.today() – timedelta(1) yesterday = yesterday.strftime('-%m-%d-%y') all_data = pd.DataFrame() for f in glob.glob('Z:*[yesterday]*'): df = pd.read_excel(f) all_data = all_data.append(df,ignore_index=True)` 但是，试图导入时不会调用variables“昨天”。我知道我的语法一定是错的，因为所有文件都被调用。如何在导入条件中包含“昨天”？

打开多个XL文件，抓取数据，然后写入pandas/输出到单个Excel文件: 我是新手编程和python（使用python27），我试图编写代码来打开多个Excel文件从特定的文件夹，抓住特定的单元格值，然后输出到一个单一的Excel文件，每行代表logging文件打开。这是我的代码，我被困在下一个过程应该是什么： import os import glob import xlrd import datetime yesterday = datetime.date.fromordinal(datetime.date.today().toordinal()-1) for root,dirs,files in os.walk(src): files = [ _ for _ in files if _.endswith('.xlsx') ] for xlsfile in files: wb = xlrd.open_workbook(os.path.join(root,xlsfile)) sht = wb.sheet_by_name('Sheet1') name = xlsfile rev = sht.cell_value(0,1) gp = sht.cell_value(1,1) sls = sht.cell_value(2,1) sp = sht.cell_value(3,1) cps = […]

如何让xlwt在py2app构build中运行: 我成功地使用了xlwt在我的脚本末尾输出一个excel文件，但是当这个脚本被转换成一个独立的程序（使用py2app）时，这个excel不再被生成。其他import软件包（Tkinter的GUI）工作正常，我找不到一个地方提出这个相同的问题。（Mac OS 10.9.5，python 2.7.5：预安装的mac版本）（xlwt存在于/build/bdist.macosx-10.9-intel/python2.7-standalone/app/site-packages/中）问题被隔离到一个非常小的脚本，输出一个excel文件，一个填充单元格： def export_xcl(): import xlwt wb = xlwt.Workbook()#initialize excel sheet ws = wb.add_sheet('Sheet1') text_cells=xlwt.easyxf('font: name Times New Roman') ws.write(0,0, 'jaja',text_cells) print ('voor het saven') wb.save('testx.xls') print ('na het saven') if __name__ == '__main__': export_xcl() 这个脚本在正常启动时运行完美。可执行文件却没有。 py2app使用的setup.py文件如下： from setuptools import setup APP = ['testx.py'] DATA_FILES = [] OPTIONS = […]

反正我们可以使用python调用excel插件吗？: 反正我们可以使用python调用excel插件吗？我想调用一个用户定义的加载项，它是在Excel中使用Python程序。我需要一个免费软件，我认为pyxll需要许可证。

如何使用汤＆python从Wikipedia的表中的特定列下的内容: 我需要从维基百科的表格中获取内容指向特定列下的href链接。该页面是“ http://en.wikipedia.org/wiki/List_of_Telugu_films_of_2015 ”。在这个页面上，有几个表格“wikitable”。我需要列标题下的内容的链接，他们指向的每一行。我希望将它们复制到Excel表格中。我不知道在一个特定的列下search的确切代码，但我到这里来，我得到一个“Nonetype对象不可调用” 。我正在使用bs4。我想提取至less部分表格，所以我可以弄清楚我想要的标题列下的href链接，但是我以这个错误结束。代码如下： from urllib.request import urlopen from bs4 import BeautifulSoup soup = BeautifulSoup(urlopen('http://en.wikipedia.org/wiki/List_of_Telugu_films_of_2015').read()) for row in soup('table', {'class': 'wikitable'})[1].tbody('tr'): tds = row('td') print (tds[0].string, tds[0].string) 一点指导赞赏。有谁知道？

Win32com不调度excel，说'服务器执行失败': 我最初的脚本是： import win32com.client import os file1= r'C:\\Users\cevans\Desktop\models1\file.xlsm' def refresher(): if os.path.exists(file1): xl = win32com.client.Dispatch("Excel.Application") xl.Workbooks.Open(Filename=file1,ReadOnly=1) xl.Visible = True xl.Application.Run('Report_Tablerefresh1') xl.Workbooks(1).Close(SaveChanges=1) xl.Application.Quit() del xl refresher() 当我尝试做一个简单的excel调度时，我遇到了这个错误，奇怪的是这个脚本已经运行好几个星期了，然后这个错误popup来了。有什么build议么？ Traceback (most recent call last): File "C:/Users/cevans/PycharmProjects/RigLocatorMapPull/Pipe_StorageRefresh.py", line 17, in <module> refresher() File "C:/Users/cevans/PycharmProjects/RigLocatorMapPull/Pipe_StorageRefresh.py", l ine 10, in refresher xl = win32com.client.Dispatch("Excel.Application") File "C:\Python27\lib\site-packages\win32com\client\__init__.py", line 95, in Dispatch dispatch, […]

我如何删除空白行输出时使用python写入logging到csv而不写在csv中存在的所有logging？: 我一直试图删除我的CSV文件中的logging之间的空白行使用Python而不擦除整个电子表格。 import csv, os def display(file): # this procedure displays file and returns the last ID f=csv.reader(open(file,'r')) for i in f: ID = i[0] print i return ID def newentry(file, rec): # this writes the rec to the file f=csv.writer(open(file,'a')) f.writerow(rec) #————————————– ''' this is the main program that – 1. creates the next ID […]

在Excel中匹配一个特定的string，并使用python打印这些行: 我正试图打印Excel中的4列的值。我需要匹配第四列中的特定string，然后只打印那些具有该string的行。（例如：如果我在第二行的第四列包含“甜”，我会打印整行）示例excel： name; number; fruit; comment test1 ;1 ; apple ; healthy test2; 2; banana ;sweet and healthy 这里row2应该打印到目前为止，我有这个，不能得到确切的方式来匹配string。 import gzip import csv, io with gzip.open("/test.csv.gz", "r") as file: datareader = csv.reader(file) included_cols = [9, 10, 11] for row in datareader: content = list(row[i] for i in included_cols if row[i]) print content

与…一起使用读取xls文件的列表，将其复制到具有多个工作表的单个工作簿中: 第一次在这里我的总体目标是将3个不同的xls文件中的数据准确复制到一个xls工作簿中，并为每个原始xls文件添加一个工作表。从非程序的意义上说，我想从一个新的工作簿（xls或xlsx文件）中将每个xls文件中的数据复制并粘贴到它自己的工作表中。我一直在使用xlrd＆xlwt来做到这一点，并在search的帮助下，我已经能够获得大部分的代码集。但是，我很难理解如何使用with … open命令从每个原始xls文件读取数据并将其放在自己的工作表上。正如你可能从我的代码块学习，我的Python技能是有限的。谢谢！ import xlwt as xlwt from os.path import join import xlrd wb = xlwt.Workbook() path = r'C:\data_path\\' xls1 = 'file1.xls' xls2 = 'file2.xls' xls3 = 'file3.xls' Sheet1 = 'file1_data' Sheet2 = 'file2_data' Sheet3 = 'file3_data' names = [Sheet1, Sheet2, Sheet3] dataset = [path + xls1, path + […]