Tag: 数据框

Python,Pandas删除指定列中具有特定值的行

一个Excel电子表格如下所示。 对于大pandas,我想删除“项目A”和“项目D”栏中的“项目C”和“项目E”栏以及值为“XX”的所有行。 import pandas as pd import numpy as np work_file = "C:\\test.xlsx" df = pd.read_excel(work_file, sheetname = "Sheet1", index_col = 0) column_list_to_remove = [“Project C", “Project E"] results1 = df.drop(column_list_to_remove, axis=1) writer = pd.ExcelWriter("C:\\test new.xlsx") pd.formats.format.header_style = None results1.to_excel(writer,'Sheet1') writer.save() 上面的工作很好,在删除列。 我尝试在这行添加删除“项目A”中值“XX”的行,并失败。 没有希望删除“D项目”中的那些。 results1 = results1[results1."Project A" != "XX"] # SyntaxError: invalid syntax 我怎样才能删除这些行? […]

从Excel文档导入数据头,使用pandassearch网页,然后在同一个Excel文档中导出到特定的行/列

我想弄清楚如何从一个特定的excel表导入数据,根据这些数据search雅虎财经的信息,然后打印通过雅虎收到的数据(通过pandas web.datareader)到同一个Excel中的特定行/列文件。 这是我迄今为止,但它不完成我要做的事情。 这将根据代码内的inputsearch信息,而不是从Excel工作表input,并将连接的数据框导出到新创build的电子表格,而不是预先存在的特定行和列。 import datetime as dt from datetime import datetime import pandas as pd import pandas_datareader.data as web start = dt.datetime.strptime("8/11/2017", "%m/%d/%Y") end = dt.datetime.today() headerlist = ('stock1 Open', 'stock1 Close', 'stock2 Open', 'stock2 Close', 'stock3 Open', 'stock3 Close', 'stock4 Open', 'stock4 Close') df1 = web.DataReader('stock1', 'yahoo', start, end)[['Open','Close']] df2 = web.DataReader('stock2', 'yahoo', […]

在全部3个dataframe的列A中查找A列

如何查看所有3个dataframeA列中的A列 我的数据看起来像从A,B开始 DFA a 1 dd 3 aa 4 DFB c 5 zz 6 dd 7 a 8 DFC a 33 c 44 dd 55 zz 66 欲望输出 a 1 a 8 a 33 dd 3 dd 7 dd 55 大pandas是否具有类似于Excel的多种查找方式? 我看到很多2列的例子,而不是查看所有数据框中的A列。

有没有办法写两个(或更多)数据框到一个Excel电子表格?

如果我可以使用pandas和xlsxwriter来将两个数据框(一个在另一个之上)堆叠在同一张Excel上,那么它将帮助我生成更加整洁,更加“人性化”的输出电子表格我输出。 请注意两个dataframe的数据是相关但不同的,一个是另一个的总结。 有没有一个简洁的方法,我可以把我的数据框和我的总结数据框,并将其堆叠在同一张表上?

将几个Pandas DataFrames保存到一个Excel文件中

我有几个pandas数据框,我想保存到单个MS Excel文件,每个数据框作为单独的工作表在这个文件。 任何build议比欢迎。 费利克斯

pandas阅读excel文件与简单的多列索引

我有一个看起来像这样的excel文件 当我读这个pandas.read_excelpandas返回一个df,看起来像这样: 1998 Unnamed: 1 1999 Unnamed: 3 \ Angélus 20 -35 16 au Angludet 17 au 16 vo Arnaud de Jacquemeau 16 vo 16 vo Ausone 20 -40 18 -25 Barde-Haut 17 au 17 vo 有没有办法告诉pandas关于多列的输出呢? 1998 1998 1999 1999 Angélus 20 -35 16 au Angludet 17 au 16 vo Arnaud de Jacquemeau 16 […]

pandas过滤多列单标准

我有一个超过一百列的Excel表。 我需要筛选其中五个以查看哪些列在其中一个单元格中为“否”。 有没有办法使用单个search条件来筛选多个列: no_invoice_filter = df[(df['M1: PL – INVOICED']) & (df['M2: EX – INVOICED']) & (df['M3: TEST DEP – INVOICED']) == 'No'] 如果每栏都等于“否”,分别写出来, 上面的代码错误: TypeError: unsupported operand type(s) for &: 'str' and 'bool'

如何通过python将数据框复制到excel中的某个位置?

我想添加一个数据框从excel中的某个单元格位置开始,但似乎df.to_excel总是从'A1'开始,所以任何其他方式可以做到这一点? 如添加 64 65 START DATE 0 54.37 65.37 2013-05-03 00:00:00 1 43.52 51.23 2013-06-05 00:00:00 从单元格E3:F5(不包括标题和索引)

使用groupby重新格式化excel数据,并在python中将空行添加到dataframe

我有一个为期一年的60分钟计数降雨的长期excel文件。 我正在查看excel文件,将总的降雨量值汇总为日总降雨量( group.by well well),然后将这些值放入一个新的dataframe中,每年的每一天都是一个单独的行,如果有那天没有下雨,下雨的时候总的日降雨量Value 。 我已经概述了我会采取的步骤和我在下面的代码的尝试。 我打开其他build议,如果我试图编码是废话。 Excel文件的第一行如下所示: 60 Minute Counts, [] Time Stamp Latitude Longitude Value () Dec 27 2015 01:30:00 AM 0.297 36.900 0.25 Dec 25 2015 01:00:00 PM 0.297 36.900 0.51 Dec 25 2015 10:30:00 AM 0.297 36.900 0.25 Dec 25 2015 07:30:00 AM 0.297 36.900 0.25 Dec 25 2015 05:00:00 […]

Python – 基于另一列中的值获取两个colums的最大值还是最小值?

假设有以下数据的dataframe key score1 score2 count 1 0.87 0.13 0 2 0.67 0.33 1 3 0.46 0.54 1 4 0.28 0.72 0 5 0.41 0.59 1 如果count == 0或max [score1,score2] count> 0时,findmin [score1,score2]的最短途径是什么? 目前的解决scheme是 data['mini']=data[[score1, score2]].min(axis=1) data['maxi']=data[[score1, score2]].max(axis=1) data['fin_score']= data['mini'].where(data['count']==0, data['maxi']) 有没有办法可以做得更清脆(在一半的命令),就像在Excel中这将如下,然后拖动公式跨所有行 =IF(count>0,MAX(B2:C2),MIN(B2:C2)) 结果会是这样的 key score1 score2 count fin_score 1 0.87 0.13 0 0.13 2 0.67 […]