Tag: 数据框

取消隐藏和隐藏工作簿中的列

如果数据不是他们的数据,他们是否将数据隐藏在Excel工作簿中? 比如说我用 df = pd.read_excel('Test.xlsx) 它产生的数据框有一个表格,其中有1月至12月已经制作的列因为我只有1月份和2月份的数据,所以我只希望显示这些列。 原因是三月到十二月没有数据,所以栏目空白。 我想基本上隐藏列,除非他们是在他们的数据,当数据确实存在于这些列我希望它取消隐藏,并显示该月的数据。

pandas:根据公共列名称将多个数据框中的列提取到新的数据框中

我从Excel导入4个数据集,包含2013学年,2014,2015和2016学年的total_budget。所有数据集都有一个共同的列,每个学校的ID代码(列LAESTAB)。 我想要一个新的数据集,左边是共同列LAESTAB(4个数据集中的值相同),然后是总共2013,总计2014,总计2015和总数2016(来自不同数据集)。 我也想摆脱其余的数据,包括所有数据集中不存在的学校ID。 我将尝试在一个例子中进一步阐述它: 下面是一个Excel数据集的例子: >>> print cuts2016.head() LA_codelocal_authority_name UPIN URN LAESTAB \ 0 201 City of London 500000 0.0 2013614 1 202 Camden 500005 0.0 2022095 2 202 Camden 500007 0.0 2022219 3 202 Camden 500012 0.0 2022502 4 202 Camden 500014 0.0 2022603 School Name Academy? Phase Provider Type \ 0 Sir John […]

如何在Python中使用pandas添加现有的Excel表中的列

import pandas as pd from pandas import ExcelWriter trans=pd.read_csv('HMIS-DICR-2011-12-Manipur-Bishnupur.csv') df=trans[["April 10-11","May 10-11","June 10-11","July 10-11","August 10-11","September 10-11","October 10-11","November 10-11","December 10-11","January 10-11","February 10-11","March 10-11","April 11-12","May 11-12","June 11-12","July 11-12","August 11-12","September 11-12","October 11-12","November 11-12","December 11-12","January 11-12","February 11-12","March 11-12"]] writer1 = ExcelWriter('manipur1.xlsx') df.to_excel(writer1,'Sheet1',index=False) writer1.save() 该代码成功地将数据写入到工作表1中,但是如何将来自不同excel文件(下面提及)的另一个数据框(df)的数据附加到现有工作表(工作表1)“manipur1”excel文件 例如:我的数据框是这样的: trans=pd.read_csv('HMIS-DICR-2013-2014-Manipur-Bishnupur.csv') df=trans[["April 12-13","May 12-13","June 12-13","July 12-13","August 12-13","September 12-13","October 12-13","November 12-13","December 12-13","January 12-13","February 12-13","March 12-13","April […]

以dtype:object格式从pandas DataFrame获取列名称

对于上述链接中的内容我有类似的疑问。 而不是列表中的列名称,我想要的格式dtype:object的列名称。 例如, A B C D Name:x,dtype:object 我正在使用xlsx格式的Excel文件。 链接: 从pandasDataFrame列标题获取列表

如何遍历多个Excel表单并在新列中追加表单名称?

我有一个从多选项卡Excel导入的数据框,我想合并成一个大的数据框。 但是首先,我想创build一个新的列,将相应的图纸名添加到每个数据框(即对于数据框A,创build值为“A”的新列,为数据框B创build具有值“B”的新列)。 有一个简单的方法来做到这一点? 我想象了一种循环,但是我一直无法find解决scheme,说明如何从Excel中提取图纸名称。 希望有关如何做到这一点的任何提示。 谢谢!

从pandas导入Excel,但缺less索引标头

我想从xlsx使用这个数据: Fe Mg Al Si PSK Ca Ti 5 0.80 2.09 3.49 7.05 0.19 0.07 0.13 84.28 1.90 5 0.75 2.69 3.91 12.42 0.13 0.09 0.18 78.18 1.64 3 0.87 2.66 3.71 7.64 0.17 0.05 0.12 82.97 1.81 …………… 但是当我input时: file = 'test.xlsx' xl = pd.ExcelFile(file) df1 = xl.parse('Sheet1') 而不是尝试给0列命名,但我只能将Fe重命名为Fabric: new_columns = df1.columns.values; new_columns[0] = […]

在R中的多个Excel文件中的列中创build一个数据框

我有一些Excel文件,每个文件都有一个名为Distance的列; 我想把所有的Distance列放入一个dataframe ; 我用下面的方法把它们读入R中 file.list <- list.files(pattern = '*.xlsx') df.list <- lapply(file.list, read_excel) 现在在df.list我有30个文件,我想创build一个dataframe df.list Distance1, Distance2, …, Distance30 df.list Distance1, Distance2, …, Distance30 df.list 。 谁能帮我这个?

从pandas数据框的列索引中获取string列表

首先,我的.xlsx时间序列数据如下所示: 这是我如何阅读它: def loaddata(filepaths): t1 = time.clock() for i in range(len(filepaths)): xl = pd.ExcelFile(filepaths[i]) df = xl.parse(xl.sheet_names[0], header=0, index_col=2, skiprows=[0,2,3,4], parse_dates=True) df = df.dropna(axis=1, how='all') df = df.drop(['Decimal Year Day', 'Decimal Year Day.1', 'RECORD'], axis=1) df.index = pd.DatetimeIndex(((df.index.asi8/(1e9*60)).round()*1e9*60).astype(np.int64)).values if i == 0: dfs = df else: dfs = concat([dfs, df], axis=1) t2 = time.clock() print […]

在数据集点r的列中转换逗号

我从excel中导入了一个数据集。 我有一个专栏“高度”,我想用'。'代替','。 。 我尝试了这个命令,但它给了我错误。 apply(apply(DATASET$Height, 2, gsub, patt=",", replace="."), 2, as.numeric) 非常感谢您的帮助

如何检索和存储从Python数据框的多个值?

我有以下数据框表示一对点之间的距离距离matrix。 我有预定的“旅行”,访问特定的点对,我需要计算的总距离。 例如, Trip 1 = [A:B] + [B:C] + [B:D] = 6 + 5 + 8 = 19 行程2 = [A:D] + [B:E] + [C:E] = 6 + 15 + 3 = 24 import pandas graph = {'A': {'A': 0, 'B': 6, 'C': 10, 'D': 6, 'E': 7}, 'B': {'A': 10, 'B': 0, 'C': […]