Tag: pandas

写数据框以优于标题

我想在Excel中打印一个数据框。 我正在使用ExcelWriter,如下所示: writer = pd.ExcelWriter('test.xlsx') df = DataFrame(C,ind) # C is the matrix and ind is the list of corresponding indices df.to_excel(writer, startcol = 0, startrow = 5) writer.save() 这产生了我所需要的,除此之外,我想添加一个标题与一些文本(解释)的表顶部的数据( startcol=0 , startrow=0 )。 如何使用ExcelWriter添加string标题?

使用Pyxll将数组从Excel导入到Python Pandas中

我拼命地尝试使用Pyxll为了写一些Excel函数,获取一堆数组,加载它们在Python中,将它们转换为大pandas数据框,播放数据一点,然后返回最终的DataFrame。 现在,为了返回DataFrame,我发现了pyxll的例子 ,但不pipe我怎么尝试,我似乎无法将我加载的excel数组转换成我可以使用的pandas DataFrame。 例如,我尝试使用下面的代码,但没有运气。 也许如果我有一些方法知道Python中加载了什么以及它的外观,也许我有更好的机会来理解如何操作数据,但我不知道如何查看Canopy输出区域上的输出。 有谁知道一个简单的方法来从Excel导入数据到Python,处理它,然后将其返回到Excel,而不必保存文件,加载到Python,处理数据和覆盖现有的文件? @xl_func("string[] name, var[] day, string[] method, string[] currency, numpy_array amounts, date[] dates: dataframe") def test(name, day, method, currency, amounts, dates): df_name = DataFrame(name, columns = ['Name']) df_method = DataFrame(method, columns = ['Method']).ix[1:] df_currency = DataFrame(currency, columns = ['Currency']).ix[1:] df = df_name.join(df_method).join(df_currency) cols = ['Name', 'Currency', 'Method'] df = […]

使用Python / Pandas将多索引数据写入excel文件

我想创build一个Excel电子表格,并为每个variables插入相同数量的行。 理想的结果应该看起来像图片中的列A和B. 我到目前为止所能做的只是插入一个名字(Columns D&E),而不知道为其余的进行适当的枚举。 这是我的: import xlwt, xlrd import os current_file = xlwt.Workbook() write_table = current_file.add_sheet('Sheet1') name_list = ["Jack", "David", "Andy"] food_list = ["Ice-cream", "Mango", "Apple", "Cake"] total_rows = len(name_list) * len(food_list) # how to use it? write_table.write(0, 0, "Jack") for row, food in enumerate(food_list): write_table.write(row, 1, food) current_file.save("c:\\name_food.xls") 我怎样才能做到这一点? 谢谢。

pandas阅读excel:不要parsing数字

我正在使用Pythonpandas和MS Excel编辑一个xlsx文件。 我在这些程序之间来回迭代。 该文件包含一些文字看起来像数字的列,例如, 如果我读了这个,我明白了 pd.read_excel ('test.xlsx') A 0 1 1 100 和 pd.read_excel ('test.xlsx').dtypes A int64 dtype: object 我的问题是:如何才能将文本读取为文本? 阅读后不能parsing它,因为部分信息(即前导零)在转换为数字时会丢失。 感谢您的帮助。

将许多小型数据框导出到单个Excel工作表

使用此代码 ,可以将每个数据框导出到迭代数据框列表的新工作表中: def save_xls(list_dfs, xls_path): writer = ExcelWriter(xls_path) for n, df in enumerate(list_dfs): df.to_excel(writer,'sheet_dati%s' % n) writer.save() save_xls(list_dfs, xls_path) 但是可以在一个工作表中导出两个或多个数据框?

将Excel电子表格读入pandas数据框时,将数字转换为string

我正在使用read_excel一些excel电子表格(xlsx格式)读取到pandas中,这通常效果很好。 我遇到的问题是,当一列包含数字,pandas将它们转换为float64types,我希望它们被视为string。 读完后,我可以将列转换为str: my_frame.my_col = my_frame.my_col.astype('str') 这工作尽可能为列分配正确的types,但是当我查看这个列中的值时,string格式化为科学格式,例如8.027770e + 14,这不是我想要的。 我想知道如何告诉大pandas将字段读取为string,或者稍后再进行转换,以便以原始(非科学)格式获取值。

pandasExcel作家使用Openpyxl与现有的工作簿

我有一段时间的代码,我正在重新使用一个新的任务。 其任务是将新的DataFrame写入新的工作表,放入现有的Excel文件中。 但是有一部分代码我不明白,但是只是让代码“工作”。 加工: from openpyxl import load_workbook import pandas as pd file = r'YOUR_PATH_TO_EXCEL_HERE' df1 = pd.DataFrame({'Data': [10, 20, 30, 20, 15, 30, 45]}) book = load_workbook(file) writer = pd.ExcelWriter(file, engine='openpyxl') writer.book = book # <—————————- piece i do not understand df1.to_excel(writer, sheet_name='New', index=None) writer.save() writer.book=book小部分writer.book=book我难writer.book=book 。 如果没有这段代码,Excel文件将删除除df1.to_excel中的sheetname=参数中使用的工作表之外的所有其他工作表。 我看着xlsxwriter的文档以及openpyxl的 ,但似乎无法弄清楚为什么这一行给了我预期的输出。 有任何想法吗? 编辑:我相信这个职位是我从哪里得到了最初的想法。

pandas:如何在导出到Excel后格式化单元格

我正在将一些pandas数据框导出到Excel中: df.to_excel(writer, sheet) wb = writer.book ws = writer.sheets[sheet] ws.write(1, 4, "DataFrame contains …") writer.save() 我知道我可以使用格式类: http : //xlsxwriter.readthedocs.org/format.html格式单元格,因为我把它们写入Excel。 但是,我不知道在单元格写入Excel 之后应用格式样式的方法。 例如,如何设置为粗体和水平alignment到我已经导出到Excel的dataframne的行= 2和列= 3中的项目?

pandas:将dataframe分割成多张相同的电子表格

假设我有3个相同长度的字典,我将其合并为一个独特的pandas数据框。 然后我把这个数据框转储到一个Excel文件中。 例: import pandas as pd from itertools import izip_longest d1={'a':1,'b':2,'c':3,'d':4,'e':5,'f':6} d2={'a':1,'b':2,'c':3,'d':4,'e':5,'f':6} d3={'a':1,'b':2,'c':3,'d':4,'e':5,'f':6} dict_list=[d1,d2,d3] stats_matrix=[ tuple('dict{}'.format(i+1) for i in range(len(dict_list))) ] + list( izip_longest(*([ v for k,v in sorted(d.items())] for d in dict_list)) ) stats_matrix.pop(0) mydf=pd.DataFrame(stats_matrix,index=None) mydf.columns = ['d1','d2','d3'] writer = pd.ExcelWriter('myfile.xlsx', engine='xlsxwriter') mydf.to_excel(writer, sheet_name='sole') writer.save() 此代码将生成一个带有唯一表的Excel文件: >Sheet1< d1 d2 d3 1 1 1 […]

从多级Excel文件通过pandas整理数据

我想从一个看起来像这样的Excel文件产生整洁的数据,三个级别的“合并”标题: pandas阅读文件很好,多级头: # df = pandas.read_excel('test.xlsx', header=[0,1,2]) 对于可重复性,您可以复制粘贴: df = pandas.DataFrame({('Unnamed: 0_level_0', 'Unnamed: 0_level_1', 'a'): {1: 'aX', 2: 'aY'}, ('Unnamed: 1_level_0', 'Unnamed: 1_level_1', 'b'): {1: 'bX', 2: 'bY'}, ('Unnamed: 2_level_0', 'Unnamed: 2_level_1', 'c'): {1: 'cX', 2: 'cY'}, ('level1_1', 'level2_1', 'level3_1'): {1: 1, 2: 10}, ('level1_1', 'level2_1', 'level3_2'): {1: 2, 2: 20}, ('level1_1', 'level2_2', 'level3_1'): {1: […]