Tag: pandas

写数据框以优于标题: 我想在Excel中打印一个数据框。我正在使用ExcelWriter，如下所示： writer = pd.ExcelWriter('test.xlsx') df = DataFrame(C,ind) # C is the matrix and ind is the list of corresponding indices df.to_excel(writer, startcol = 0, startrow = 5) writer.save() 这产生了我所需要的，除此之外，我想添加一个标题与一些文本（解释）的表顶部的数据（ startcol=0 ， startrow=0 ）。如何使用ExcelWriter添加string标题？

使用Pyxll将数组从Excel导入到Python Pandas中: 我拼命地尝试使用Pyxll为了写一些Excel函数，获取一堆数组，加载它们在Python中，将它们转换为大pandas数据框，播放数据一点，然后返回最终的DataFrame。现在，为了返回DataFrame，我发现了pyxll的例子，但不pipe我怎么尝试，我似乎无法将我加载的excel数组转换成我可以使用的pandas DataFrame。例如，我尝试使用下面的代码，但没有运气。也许如果我有一些方法知道Python中加载了什么以及它的外观，也许我有更好的机会来理解如何操作数据，但我不知道如何查看Canopy输出区域上的输出。有谁知道一个简单的方法来从Excel导入数据到Python，处理它，然后将其返回到Excel，而不必保存文件，加载到Python，处理数据和覆盖现有的文件？ @xl_func("string[] name, var[] day, string[] method, string[] currency, numpy_array amounts, date[] dates: dataframe") def test(name, day, method, currency, amounts, dates): df_name = DataFrame(name, columns = ['Name']) df_method = DataFrame(method, columns = ['Method']).ix[1:] df_currency = DataFrame(currency, columns = ['Currency']).ix[1:] df = df_name.join(df_method).join(df_currency) cols = ['Name', 'Currency', 'Method'] df = […]

使用Python / Pandas将多索引数据写入excel文件: 我想创build一个Excel电子表格，并为每个variables插入相同数量的行。理想的结果应该看起来像图片中的列A和B. 我到目前为止所能做的只是插入一个名字（Columns D＆E），而不知道为其余的进行适当的枚举。这是我的： import xlwt, xlrd import os current_file = xlwt.Workbook() write_table = current_file.add_sheet('Sheet1') name_list = ["Jack", "David", "Andy"] food_list = ["Ice-cream", "Mango", "Apple", "Cake"] total_rows = len(name_list) * len(food_list) # how to use it? write_table.write(0, 0, "Jack") for row, food in enumerate(food_list): write_table.write(row, 1, food) current_file.save("c:\\name_food.xls") 我怎样才能做到这一点？谢谢。

pandas阅读excel：不要parsing数字: 我正在使用Pythonpandas和MS Excel编辑一个xlsx文件。我在这些程序之间来回迭代。该文件包含一些文字看起来像数字的列，例如，如果我读了这个，我明白了 pd.read_excel ('test.xlsx') A 0 1 1 100 和 pd.read_excel ('test.xlsx').dtypes A int64 dtype: object 我的问题是：如何才能将文本读取为文本？阅读后不能parsing它，因为部分信息（即前导零）在转换为数字时会丢失。感谢您的帮助。

将许多小型数据框导出到单个Excel工作表: 使用此代码，可以将每个数据框导出到迭代数据框列表的新工作表中： def save_xls(list_dfs, xls_path): writer = ExcelWriter(xls_path) for n, df in enumerate(list_dfs): df.to_excel(writer,'sheet_dati%s' % n) writer.save() save_xls(list_dfs, xls_path) 但是可以在一个工作表中导出两个或多个数据框？

将Excel电子表格读入pandas数据框时，将数字转换为string: 我正在使用read_excel一些excel电子表格（xlsx格式）读取到pandas中，这通常效果很好。我遇到的问题是，当一列包含数字，pandas将它们转换为float64types，我希望它们被视为string。读完后，我可以将列转换为str： my_frame.my_col = my_frame.my_col.astype('str') 这工作尽可能为列分配正确的types，但是当我查看这个列中的值时，string格式化为科学格式，例如8.027770e + 14，这不是我想要的。我想知道如何告诉大pandas将字段读取为string，或者稍后再进行转换，以便以原始（非科学）格式获取值。

pandasExcel作家使用Openpyxl与现有的工作簿: 我有一段时间的代码，我正在重新使用一个新的任务。其任务是将新的DataFrame写入新的工作表，放入现有的Excel文件中。但是有一部分代码我不明白，但是只是让代码“工作”。加工： from openpyxl import load_workbook import pandas as pd file = r'YOUR_PATH_TO_EXCEL_HERE' df1 = pd.DataFrame({'Data': [10, 20, 30, 20, 15, 30, 45]}) book = load_workbook(file) writer = pd.ExcelWriter(file, engine='openpyxl') writer.book = book # <—————————- piece i do not understand df1.to_excel(writer, sheet_name='New', index=None) writer.save() writer.book=book小部分writer.book=book我难writer.book=book 。如果没有这段代码，Excel文件将删除除df1.to_excel中的sheetname=参数中使用的工作表之外的所有其他工作表。我看着xlsxwriter的文档以及openpyxl的，但似乎无法弄清楚为什么这一行给了我预期的输出。有任何想法吗？编辑：我相信这个职位是我从哪里得到了最初的想法。

pandas：如何在导出到Excel后格式化单元格: 我正在将一些pandas数据框导出到Excel中： df.to_excel(writer, sheet) wb = writer.book ws = writer.sheets[sheet] ws.write(1, 4, "DataFrame contains …") writer.save() 我知道我可以使用格式类： http : //xlsxwriter.readthedocs.org/format.html格式单元格，因为我把它们写入Excel。但是，我不知道在单元格写入Excel 之后应用格式样式的方法。例如，如何设置为粗体和水平alignment到我已经导出到Excel的dataframne的行= 2和列= 3中的项目？

pandas：将dataframe分割成多张相同的电子表格: 假设我有3个相同长度的字典，我将其合并为一个独特的pandas数据框。然后我把这个数据框转储到一个Excel文件中。例： import pandas as pd from itertools import izip_longest d1={'a':1,'b':2,'c':3,'d':4,'e':5,'f':6} d2={'a':1,'b':2,'c':3,'d':4,'e':5,'f':6} d3={'a':1,'b':2,'c':3,'d':4,'e':5,'f':6} dict_list=[d1,d2,d3] stats_matrix=[ tuple('dict{}'.format(i+1) for i in range(len(dict_list))) ] + list( izip_longest(*([ v for k,v in sorted(d.items())] for d in dict_list)) ) stats_matrix.pop(0) mydf=pd.DataFrame(stats_matrix,index=None) mydf.columns = ['d1','d2','d3'] writer = pd.ExcelWriter('myfile.xlsx', engine='xlsxwriter') mydf.to_excel(writer, sheet_name='sole') writer.save() 此代码将生成一个带有唯一表的Excel文件： >Sheet1< d1 d2 d3 1 1 1 […]

从多级Excel文件通过pandas整理数据: 我想从一个看起来像这样的Excel文件产生整洁的数据，三个级别的“合并”标题： pandas阅读文件很好，多级头： # df = pandas.read_excel('test.xlsx', header=[0,1,2]) 对于可重复性，您可以复制粘贴： df = pandas.DataFrame({('Unnamed: 0_level_0', 'Unnamed: 0_level_1', 'a'): {1: 'aX', 2: 'aY'}, ('Unnamed: 1_level_0', 'Unnamed: 1_level_1', 'b'): {1: 'bX', 2: 'bY'}, ('Unnamed: 2_level_0', 'Unnamed: 2_level_1', 'c'): {1: 'cX', 2: 'cY'}, ('level1_1', 'level2_1', 'level3_1'): {1: 1, 2: 10}, ('level1_1', 'level2_1', 'level3_2'): {1: 2, 2: 20}, ('level1_1', 'level2_2', 'level3_1'): {1: […]