Tag: python

如何使用index和pandas.read_excel来读取excel表格?

我知道这很容易与pandas.io.parser ExcelFile完成,但文档说,他们从未来版本的pandas下降ExcelFile,所以我想知道如何用replaceread_excel()做到​​这一点。 该文档说,您可以通过执行以下操作使用图表索引: read_excel('path_to_file.xls', 0, index_col=None, na_values=['NA']) 每次我尝试这个,我得到以下错误: XLRDError: No sheet named <0>

Python CSV写入文件在Excel中无法读取(中文字符)

我正在尝试对中文文本进行文本分析。 该程序在下面提供。 我得到了浜烘皯鏃ユ姤绀捐辨认的人物的结果。 如果将输出文件result.csv更改为result.txt ,则这些字符与人民日报社论 。 那么这有什么问题? 我无法弄清楚。 我尝试了几种方法,包括加decoder和encoder 。 # -*- coding: utf-8 -*- import os import glob import jieba import jieba.analyse import csv import codecs segList = [] raw_data_path = 'monthly_raw_data/' file_name = ["201010", "201011", "201012", "201101", "201103", "201105", "201107", "201109", "201110", "201111", "201112", "201201", "201202", "201203", "201205", "201206", "201208", "201210", "201211"] jieba.load_userdict("customized_dict.txt") […]

pandasdataframe更换速度缓慢

我有一个Excel文件(.xlsx),大约有800行,128列,网格中的数据非常密集。 大约有9500个单元我试图用Pandas数据框取代单元格的值: xlsx = pandas.ExcelFile(filename) frame = xlsx.parse(xlsx.sheet_names[0]) media_frame = frame[media_headers] # just get the cols that need replacing from_filenames = get_from_filenames() # returns ~9500 filenames to replace in DF to_filenames = get_to_filenames() media_frame = media_frame.replace(from_filenames, to_filenames) frame.update(media_frame) frame.to_excel(filename) replace()需要60秒。 任何方式来加速呢? 这不是一个庞大的数据或任务,我期待大pandas的动作要快得多。 仅供参考我试着用同样的文件在CSV中做同样的处理,但节省的时间是最less的( replace()约50秒)

如何将Xlsxwriter文件保存在某个path中?

Xlsxwriter在哪里保存你创build的文件? 是否可以指定我想要保存excel文件的path? 我的XlsxWriter脚本在文件/ app / smth1 / smth2 /中,由于某种原因,它将excel文件保存到/ app /中。 它不应该保存在脚本所在的文件中吗? 或者我必须指定这样的path: workbook = xlsxwriter.Workbook(' /app/smth1/smth2/Expenses01.xlsx') Excel文件保存的默认文件是什么?

在Excel中使用xlwt格式化为货币和小数点后两位

我有一个列标题费 。 在Python中使用xlwt ,我成功地生成了所需的excel。这个列在创buildExcel文件时总是空白的。 是否可以将费用列预格式化为“货币”和“小数点后两位”,以便在我下载后在Excel文件的费用栏中手动编写时, 23 应变为$ 23.00 ?

如何使用Python win32com调用Excel VBA函数和子文件?

我的Excel工作簿包含类似于下面的VBA子和macros; 他们坐在Module1中。 如何使用Python win32com模块调用它们? Public Sub setA1(ByVal s As String) ThisWorkbook.ActiveSheet.Range("A1").Value = s End Sub Public Function getA1() As String getA1 = ThisWorkbook.ActiveSheet.Range("A1").Value End Function 提前谢谢了!

将pandas / matplotlib图像直接写入XLSX文件

我正在pandas / matplotlib中生成图表,并希望将它们写入XLSX文件。 我不想创build本机Excel图表; 我只是把这些情节写成非交互式的图像。 我正在使用XlsxWriter库/引擎 。 我find的最接近的解决scheme是这个SO问题的答案 ,build议使用XlsxWriter.write_image()方法。 但是,此方法似乎将文件名作为其input。 我试图以编程方式传递来自pandas / matplotlib plot()调用的直接输出,例如像这样的东西: h = results.resid.hist() worksheet.insert_image(row, 0, h) # doesn't work 或这个: s = df.plot(kind="scatter", x="some_x_variable", y="resid") worksheet.insert_image(row, 0, s) # doesn't work 有没有办法做到这一点,首先将图像写入磁盘文件的解决方法? 更新 下面的答案让我在正确的轨道上,并接受。 我需要做一些改变,主要是(我认为),因为我正在使用Python 3,也许一些API的变化。 这是解决scheme: from io import BytesIO import matplotlib.pyplot as plt imgdata = BytesIO() fig, ax = […]

使用Pandas阅读带有多个标题的Excel表格

我有一个Excel头像多个头像: _________________________________________________________________________ ____|_____| Header1 | Header2 | Header3 | ColX|ColY |ColA|ColB|ColC|ColD||ColD|ColE|ColF|ColG||ColH|ColI|ColJ|ColDK| 1 | ds | 5 | 6 |9 |10 | ………………………………… 2 | dh | …………………………………………………. 3 | ge | …………………………………………………. 4 | ew | …………………………………………………. 5 | er | …………………………………………………. 现在,在这里你可以看到前两列没有标题,而是其他列有标题Header1,Header2和Header3。 所以我想阅读这张表格,并将其与其他具有相似结构的表格合并。 我想将它合并到第一列“ColX”上。 现在我正在这样做: import pandas as pd totalMergedSheet = pd.DataFrame([1,2,3,4,5], columns=['ColX']) file […]

pythonexcel制作报告

我已经被赋予用py(2.5)连接我的代码(fortran)的任务,并且如果可能的话生成一些excel报告。 第一部分进展良好 – 已经完成了,但是现在我正在进行第二部分的工作。 我从python制作excel(2007年,如果可能的话)的select是什么? 一般来说,我需要在表格中放置一些数组值(格式无关紧要),并从这些表中绘制一些图表。 有没有办法自动做到这一点? 有些图书馆? 过去有人做过这样的事情吗?

Django / Python:将HTML表格保存到Excel

我有一个HTML表,我想能够导出到Excel文件。 我已经有一个选项将表导出到一个IQY文件,但我更喜欢的东西,不允许用户通过Excel刷新数据。 我只想要一个在用户点击链接/button时获取表格快照的function。 如果该function是HTML页面上的一个链接/button,允许用户保存表中显示的查询结果,我更喜欢它。 如果可以保留HTML / CSS的格式,那也不错。 有没有办法做到这一点? 或者,我可以用IQY修改? 我可以尝试提供更多的细节,如果需要的话。 提前致谢。