Tag: 数据框

取消隐藏和隐藏工作簿中的列: 如果数据不是他们的数据，他们是否将数据隐藏在Excel工作簿中？比如说我用 df = pd.read_excel('Test.xlsx) 它产生的数据框有一个表格，其中有1月至12月已经制作的列因为我只有1月份和2月份的数据，所以我只希望显示这些列。原因是三月到十二月没有数据，所以栏目空白。我想基本上隐藏列，除非他们是在他们的数据，当数据确实存在于这些列我希望它取消隐藏，并显示该月的数据。

pandas：根据公共列名称将多个数据框中的列提取到新的数据框中: 我从Excel导入4个数据集，包含2013学年，2014,2015和2016学年的total_budget。所有数据集都有一个共同的列，每个学校的ID代码（列LAESTAB）。我想要一个新的数据集，左边是共同列LAESTAB（4个数据集中的值相同），然后是总共2013，总计2014，总计2015和总数2016（来自不同数据集）。我也想摆脱其余的数据，包括所有数据集中不存在的学校ID。我将尝试在一个例子中进一步阐述它：下面是一个Excel数据集的例子： >>> print cuts2016.head() LA_codelocal_authority_name UPIN URN LAESTAB \ 0 201 City of London 500000 0.0 2013614 1 202 Camden 500005 0.0 2022095 2 202 Camden 500007 0.0 2022219 3 202 Camden 500012 0.0 2022502 4 202 Camden 500014 0.0 2022603 School Name Academy? Phase Provider Type \ 0 Sir John […]

如何在Python中使用pandas添加现有的Excel表中的列: import pandas as pd from pandas import ExcelWriter trans=pd.read_csv('HMIS-DICR-2011-12-Manipur-Bishnupur.csv') df=trans[["April 10-11","May 10-11","June 10-11","July 10-11","August 10-11","September 10-11","October 10-11","November 10-11","December 10-11","January 10-11","February 10-11","March 10-11","April 11-12","May 11-12","June 11-12","July 11-12","August 11-12","September 11-12","October 11-12","November 11-12","December 11-12","January 11-12","February 11-12","March 11-12"]] writer1 = ExcelWriter('manipur1.xlsx') df.to_excel(writer1,'Sheet1',index=False) writer1.save() 该代码成功地将数据写入到工作表1中，但是如何将来自不同excel文件（下面提及）的另一个数据框（df）的数据附加到现有工作表（工作表1）“manipur1”excel文件例如：我的数据框是这样的： trans=pd.read_csv('HMIS-DICR-2013-2014-Manipur-Bishnupur.csv') df=trans[["April 12-13","May 12-13","June 12-13","July 12-13","August 12-13","September 12-13","October 12-13","November 12-13","December 12-13","January 12-13","February 12-13","March 12-13","April […]

以dtype：object格式从pandas DataFrame获取列名称: 对于上述链接中的内容我有类似的疑问。而不是列表中的列名称，我想要的格式dtype：object的列名称。例如， A B C D Name:x,dtype:object 我正在使用xlsx格式的Excel文件。链接：从pandasDataFrame列标题获取列表

如何遍历多个Excel表单并在新列中追加表单名称？: 我有一个从多选项卡Excel导入的数据框，我想合并成一个大的数据框。但是首先，我想创build一个新的列，将相应的图纸名添加到每个数据框（即对于数据框A，创build值为“A”的新列，为数据框B创build具有值“B”的新列）。有一个简单的方法来做到这一点？我想象了一种循环，但是我一直无法find解决scheme，说明如何从Excel中提取图纸名称。希望有关如何做到这一点的任何提示。谢谢！

从pandas导入Excel，但缺less索引标头: 我想从xlsx使用这个数据： Fe Mg Al Si PSK Ca Ti 5 0.80 2.09 3.49 7.05 0.19 0.07 0.13 84.28 1.90 5 0.75 2.69 3.91 12.42 0.13 0.09 0.18 78.18 1.64 3 0.87 2.66 3.71 7.64 0.17 0.05 0.12 82.97 1.81 …………… 但是当我input时： file = 'test.xlsx' xl = pd.ExcelFile(file) df1 = xl.parse('Sheet1') 而不是尝试给0列命名，但我只能将Fe重命名为Fabric： new_columns = df1.columns.values; new_columns[0] = […]

在R中的多个Excel文件中的列中创build一个数据框: 我有一些Excel文件，每个文件都有一个名为Distance的列; 我想把所有的Distance列放入一个dataframe ; 我用下面的方法把它们读入R中 file.list <- list.files(pattern = '*.xlsx') df.list <- lapply(file.list, read_excel) 现在在df.list我有30个文件，我想创build一个dataframe df.list Distance1, Distance2, …, Distance30 df.list Distance1, Distance2, …, Distance30 df.list 。谁能帮我这个？

从pandas数据框的列索引中获取string列表: 首先，我的.xlsx时间序列数据如下所示：这是我如何阅读它： def loaddata(filepaths): t1 = time.clock() for i in range(len(filepaths)): xl = pd.ExcelFile(filepaths[i]) df = xl.parse(xl.sheet_names[0], header=0, index_col=2, skiprows=[0,2,3,4], parse_dates=True) df = df.dropna(axis=1, how='all') df = df.drop(['Decimal Year Day', 'Decimal Year Day.1', 'RECORD'], axis=1) df.index = pd.DatetimeIndex(((df.index.asi8/(1e9*60)).round()*1e9*60).astype(np.int64)).values if i == 0: dfs = df else: dfs = concat([dfs, df], axis=1) t2 = time.clock() print […]

在数据集点r的列中转换逗号: 我从excel中导入了一个数据集。我有一个专栏“高度”，我想用'。'代替'，'。。我尝试了这个命令，但它给了我错误。 apply(apply(DATASET$Height, 2, gsub, patt=",", replace="."), 2, as.numeric) 非常感谢您的帮助

如何检索和存储从Python数据框的多个值？: 我有以下数据框表示一对点之间的距离距离matrix。我有预定的“旅行”，访问特定的点对，我需要计算的总距离。例如， Trip 1 = [A：B] + [B：C] + [B：D] = 6 + 5 + 8 = 19 行程2 = [A：D] + [B：E] + [C：E] = 6 + 15 + 3 = 24 import pandas graph = {'A': {'A': 0, 'B': 6, 'C': 10, 'D': 6, 'E': 7}, 'B': {'A': 10, 'B': 0, 'C': […]