Tag: pandas

python-pandas read_excel为index_col获取错误的数字: 我试图阅读一个.xlsx文件，每个文件有4张，每个文件的时间和吸收率列如下所示： Time Absorbance 0 0.1254 5 0.1278 10 0.128 15 0.1286 20 0.1303 25 0.1295 30 0.1296 35 0.1308 40 0.1301 45 0.1301 50 0.1309 … 我想要使每个工作表的DataFrame作为不同的列和行索引当前我的代码的时间如下所示： import numpy as np import pandas as pd, datetime as dt import glob, os runDir = "/Users/AaronT/Documents/Lab/Cascade/DTRA" if os.getcwd() != runDir: os.chdir(runDir) files = glob.glob("PTE_Kinetics*.xlsx") df = pd.DataFrame() […]

在Excel中加载HDF5？: 有没有办法加载/导入到Excel中的HDF5文件（有时称为H5，HD5或分层数据格式）？我不想导出中间的CSV文件，理想情况下我想修改数据并在Excel中重新保存为HDF5（但是可接受的答案是解决加载文件的问题）。请注意，HDF5是Python的PyTables，pandas和h5py使用的格式（这些软件包中的专家可以回答这个问题）。不过，我宁愿不使用Python来解决这个问题（我宁愿现有的软件工具）。也许有一种方式与ODBC …但我不知道如何。

使用> 256列的面板to_excel: 我有pandas形状5 * 500 * 5000的面板。我想用Panel.to_excel把它保存到Excel文件中。当我尝试保存到xls文件时，它会引发ValueError：列索引（256）而不是范围（256）中的整数。据我所知，它不支持超过256列。这个函数不支持xlsb格式。我可以保存到xlsx或xlsm，但需要大量的时间和计算机资源。或者我可以手动拆分面板成几个数据框，并将其保存到几个CSV文件，但我想有一个文件的数据。我可以这样做吗？

从多个Excel文件创buildpandas数据框: 嗨所以这个问题几乎和这个一样：从多个文件创buildpandas数据框除了我想从Excel文件的列表中读取数据。我有一个名为“文件名”的文件名列表，我想合并成一个单一的数据框。我的代码是： import tkinter as tk import pandas as pd import tkinter.messagebox as tr from tkinter.filedialog import askopenfilename LARGE_FONT = ("Verdana", 12) class BlahTest(tk.Tk): def __init__(self, *args, **kwargs): tk.Tk.__init__(self, *args, **kwargs) container = tk.Frame(self) container.pack(side="top", fill="both", expand=True) container.grid_rowconfigure(0, weight=1) container.grid_columnconfigure(0, weight=1) self.frames = {} frame = StartPage(container, self) self.frames[StartPage] = frame frame.grid(row=0, […]

大pandas有时写空或损坏的文件: 我一直在使用pandas一段时间，我认为这是一个很好的工具。我做了一个程序，从用户收集的一些数据生成一些Excel文件。最终用户已经testing并使用了6个月; 它从来没有失败，直到昨天，当它产生了一个dagamaged excel文件。当我用文本编辑器打开它时，它完全是空白的。生成这个文件的代码是这样的： escritor = pandas.ExcelWriter(direccion, engine='xlsxwriter') listaTotal.to_excel(escritor, index = False) escritor.save() 和： escritor = pandas.ExcelWriter(direccion + '.xlsx', engine='xlsxwriter') self.listaFact.to_excel(escritor, index = False, startrow = 1, startcol = 0, sheet_name = 'Hoja1') escritor.save() 第二个代码片段也使用“xlsxwriter”的一些格式选项，这里是一个例子： format = workbook.add_format() format.set_font_size(9) format.set_font_name('Sans Serif 12cpi') format.set_border() format.set_text_wrap() 这个错误发生了两次; 大约1个月前和昨天。我不能重复错误，我不知道发生了什么。还有追溯在这里，它显示了程序读取文件时的问题，但是这个文件是由之前发布的代码生成的： Exception in Tkinter callback […]

使用Python来更改csv数据列格式: 我正在使用pythonpandas来读取csv文件。 csv文件有一个date时间列，其中有第二精度“9/1/2015 9:25:00 AM”，但如果我在Excel中打开，它只有微小的精度“9/1/15 9:25”。而且，当我使用pd.read_csv（）函数时，它只显示最高精度。有什么办法，我可以用python解决这个问题吗？非常感谢。

Python Pandas自定义date时间格式在Excel输出中的字体大小: 在使用to_excel()之前，Pandas中的pd.ExcelWriter的datetime_format参数非常适合格式化date时间输出。看到这里和jmcnamara的答案，回答14年9月18日在22:23。之后所做的所有格式设置都被忽略，这也在“使用Python Pandas和XlsxWriter”中的“Dataframe输出的格式 ”一节中介绍。我有两个问题：我可以更改date时间列的font_size吗？或者我必须通过xlswriter采取方式并写出原始数据？ pd.ExcelWriter()的文档在哪里？不应该有一个说明，告诉你可以使用哪些参数？我只是findto_excel()的文档; 看到这里。谢谢！

pandas数据框来优化版本更改（索引名称在单独的行从列）: 最近，我一直在使用python2.3.0，它有pandas版本0.16.2和xlsxwriter版本0.7.3。我刚刚重新安装了一个更新的Anaconda版本，它是Anaconda2-4.0.0，它有pandas版本的0.18.0和xlsxwriter 0.8.4的pandas版本。突然之间，许多用我以前写的本地excel图表生成excel文件的程序突然停止工作。这是为什么：对于一个简单的数据框，有3列名为A，B，C：使用以前版本的pandas和xlsxwriter，df.to_excel（）会生成一个像这样的excel文件，随着新的pandas和xlsxwriter版本，这是我得到的。差别很微妙。但是，由于一行的差异，依靠excel文件的程序的后续步骤停止工作。我知道我可以操纵数据框，使得excel文件中的输出看起来像前面的情况，即插入一个NaN行并将索引名称设置为“Path”。但是，我不想这样做，因为我目前的程序相当复杂，并且有超过100个数据框被放入Excel表格的Excel文件中。另一个原因是我也希望代码向后兼容，如果可能的话，如果我用Anaconda 2.3.0版运行代码，程序仍然可以工作。有没有一个单行的解决scheme，使用df.to_excel（“file_name.xlsx”），使得它将生成一个excel文件与数据框的索引名称单独的行与列。

如何添加工作表到许多Excel文件，而不使用python覆盖: 我需要写表格到excel文件（其中一些是现有的，但其他人没有）我使用df.groupby('mail').apply(lambda g: g.to_excel(str(g.name) + '.xlsx'), 'sheet1')我从exel文件分组数据，并希望用不同的mail分成很多很less。我仍然有3个df ，我想分组与mail ，也添加到其他工作sheet文件。我怎样才能在不覆盖的情况下同时发送50 mail ？

循环浏览一个文件夹，将多个Excel表格合并成一列: 我有几个练习册，每个练习册有三张。我想遍历每个工作簿，并将sheet_1所有数据合并到一个新的workbook_1文件sheet_2并将workbook_2文件＆ sheet_3合并到workbook_3中。据我可以告诉下面的脚本做我需要的一切，除了附加数据之外，它覆盖了前面迭代的数据。为简化起见，我简化了脚本，清理并简化了脚本，但如果需要的话，我很乐意分享完整的脚本。 import pandas as pd import glob search_dir= ('/Users/PATH/*.xlsx') sheet_names = ['sheet_1','sheet_2','sheet_2'] def a_joiner(sheet): for loop_x in glob.glob(search_dir): try: if sheet == 'sheet_1': id_file= pd.ExcelFile(loop_x) df_1 = id_file.parse(sheet, header= None) writer= pd.ExcelWriter('/Users/PATH/%s.xlsx' %(sheet), engine= 'xlsxwriter') df_1.to_excel(writer) writer.save() elif sheet == 'sheet_2': #do same as above else: #and do same as above […]

Tag: pandas

python-pandas read_excel为index_col获取错误的数字

在Excel中加载HDF5？

使用> 256列的面板to_excel

从多个Excel文件创buildpandas数据框

大pandas有时写空或损坏的文件

使用Python来更改csv数据列格式

Python Pandas自定义date时间格式在Excel输出中的字体大小

pandas数据框来优化版本更改（索引名称在单独的行从列）

如何添加工作表到许多Excel文件，而不使用python覆盖

循环浏览一个文件夹，将多个Excel表格合并成一列

用JavaScript打开受密码保护的Excel工作簿

如何在Microsoft Excel中格式化幻想货币？

当员工当前login到excel vba时禁用loginbutton

用VBA破解工作表密码

ios excel格式编号与颜色

使用VBA插入整个行使用特定的单元格值

如何从ASP.NET MVC导出数据到MS Excel

Excel导出图表为wmf或emf？

Excel密码保护表

Excel：查找两个列表中的区别

在Excel VBA中连接单个单元格

如何将Excel VBAmacros移植到OpenOfficemacros？

上个星期一Excel的date

在mac上自动化python中的excel

从Excel导入的Datarow不返回任何值，如果数据中有“/”