Tag: pandas

使用writer.save()将Pandas Data Frame加载到Excel中并获取索引错误

我使用numpy大小来聚合一个Pandas DF,然后想使用writer.save将结果加载到Excel中。 但是我收到以下错误: NotImplementedError:用MultiIndex写入Excel尚未实现。 我的数据看起来像这样: agt_id unique_id abc123 ab12345 abc123 cd23456 abc123 de34567 xyz987 ef45678 xyz987 fg56789 我的结果应该是这样的: agt_id unique_id abc123 3 xyz987 2 这是我的代码的一个例子: df_agtvol = df_agt.groupby('agt_id').agg({'unique_id':[np.size]}) writer = pd.ExcelWriter(outfilepath, engine='xlsxwriter') df_agtvol.to_excel(writer, sheet_name='agt_vols') 我试图重置索引使用: df_agt_vol_final = df_agtvol.set_index([df_agtvol.index, 'agt_id'], inplace=True) 基于一些研究,但是得到一个完全不同的错误。 我对Pandas数据框的工作相对比较陌生,所以任何帮助,将不胜感激。

处理“多单元格数组公式”的XLWings / Excel问题

范围 我明显地使用XLWings,从外部来源检索数据,在Python中进行一些转换,然后将其转换为Excel。 我使用的是UDF(Windows 10,Excel 2016 32位)。 我知道的唯一方法是使用“多单元格数组公式”将2维数据(Pandas数据框)添加到Excel工作表中。 问题 “多单元arrays公式”似乎有多重限制,我还没有find一个解决scheme,如何: 处理返回的数据框的dynamic大小(这是规则,而不是例外,请参阅我对github的评论 ) 格式为表(不可能),以应用着色,sorting和过滤 添加到datamodel(不可能)即join (还有什么不工作?) 题 其他人如何处理?

Python – 将数据格式化为Excel电子表格使用pandas

我想要两列数据的团队名称和行。 然而,我所有的input只是放在单元格B1中。 (请注意,在我的代码片段底部注释掉了代码)。 我想我需要循环遍历我的列表for循环,让所有的团队沿着A列,沿着B列向下,但只是用pandas来包裹我的头。 任何帮助将不胜感激! 谢谢 team = [] line = [] # Each row in table find all rows with class name team for tr in table.find_all("tr", class_="team"): # Place all text with identifier 'name' in list named team for td in tr.find_all("td", ["name"]): team.append(td.text.strip()) for tr in table.find_all("tr", class_="team"): for td in tr.find_all("td", […]

Python来遍历表和删除列

我需要阅读一个Excel文件,并在每张纸上执行一些计算。 基本上,如果列date不是“今天”,它需要删除行。 到目前为止我得到了这个代码: 导入date时间导入pandas作为PD ''' Parsing main excel sheet to save transactions != today's date ''' mainSource = pd.ExcelFile('path/to/file.xlsx') dfs = {sheet_name: mainSource.parse(sheet_name) for sheet_name in mainSource.sheet_names } for i in dfs: now = datetime.date.today(); dfs = dfs.drop(dfs.columns[6].dt.year != now, axis = 1); # It is the 6th column if datetime.time()<datetime.time(11,0,0,0): dfs.to_excel(r'path\to\outpt\test\'+str(i)+now+'H12.xlsx', index=False); #Save as […]

从excel空细胞到pandasdf

.read_excel() ,我试图使用.isin()但需要包含特定列的空单元格。 数据如何被操纵? 我读了它的NaN,但也发现NaN != NaN 。 我如何访问空的Excel单元格?

用pandas获取df.to_excel(…)后的excel文件

我正在使用Pyrebase将我的file upload到Firebase。 我有一个DataFrame DF,并将其转换为Excel文件,如下所示: writer = ExcelWriter('results.xlsx') excelFile = df.to_excel(writer,'Sheet1') print(excelFile) # Save to firebase childRef = "path/to/results.xlsx" storage = firebase.storage() storage.child(childRef).put(excelFile) 但是,这将Excel文件存储为零个字节的Office电子表格。 如果我运行writer.save()然后我得到适当的文件types( xlsx ),但它存储在我的服务器(我想避免)。 我如何才能生成正确的文件types,就像一个writer.save() ? 注意: print(excelFile)返回None

用于Python技术指标的Excel xlwings数据input

我想用xlwings复制一个简单的技术分析指标。 但是,列表/数据似乎不能读取Excel值。 下面是代码 import pandas as pd import datetime as dt import numpy as np @xw.func def EMA(df, n): EMA = pd.Series(pd.ewma(df['Close'], span = n, min_periods = n – 1), name = 'EMA_' + str(n)) df = df.join(EMA) return df 当我inputExcel数据列表:EMA =({1,2,3,4,5},5},我得到以下错误消息TypeError:列表索引必须是整数,而不是str EMA = pd.Series(pd .ewma(df ['Close'],span = n,min_periods = n – 1),name ='EMA_'+ str(n)) […]

基于date的Python VLOOKUP – Pandas

在pandas df中有一个问题,试图根据date获取“Count”列,代码应该在date列中search“date范围”,如果存在,则应将“Count”复制到“相应date的“post”列,例如:date_range value = 16/02/2017 – 代码在“date”列中search16/02/2017,并使“post”等于该date的“计数”值 – 如果date范围价值不出现 – 职位应= 0。 数据示例: Dates Count date_range Posts 0 07/02/2017 1 16/12/2016 (should = 5) 1 01/03/2017 1 17/12/2016 2 15/02/2017 1 18/12/2016 3 23/01/2017 1 19/12/2016 4 28/02/2017 1 20/12/2016 5 09/02/2017 2 21/12/2016 6 20/03/2017 2 22/12/2016 7 16/12/2016 5 我的代码如下所示: DateList = df['Dates'].tolist() […]

在Python中运行多个OLS回归

我需要运行大量的OLS回归(约1.600)。 我已经为〜1.600个观测值中的每一个收集了60个数据点。 我使用Fama&French 5因子模型,每个观察的60个数据点与样本中的date相匹配。 例如,我有一个数据框的开始date['2010-1-1']到结束date['2015-1-1']的五个因子参数。 我需要针对给定股票的股票收益率运行这些参数。 现在,由于五个因子参数被收集在一个数据框中,大约有96.000行(1600 * 60)和五列(对于每个因子),我需要select前60个观察值,用OLS对一组返回值进行运算,存储估计的系数,然后为因子参数和股票收益select接下来的 60个观测值。 我曾尝试使用切片,如: start = 0 stop = 59 empty_list = [] for i in my_data: coef = my_date[i][start:stop] # run regression with the coef slice and store them in a dataframe start += 60 stop += 60 但是,我似乎无法得到这个工作。 任何build议如何解决这个问题?

按列Python合并不同大小的表

我有两个这样的表格: Table A: id id2 value 1 1 a 1 2 b 2 1 c 3 1 d Table B: id value2 1 e 2 g 3 h 我需要join他们,所以我得到这样的事情: Table needed: id id2 value value2 1 1 ae 1 2 be 2 1 cg 3 1 dh Excel或Python或R将工作。 事实是,我需要,如果表A中的ID匹配表B中的,表B中的值被添加到匹配行(S)。 尽pipe如此,两个表的大小都不一样,有时候表b中的id也不存在于表a中。 我只需要表格a中的那个。