Tag: pandas

使用writer.save（）将Pandas Data Frame加载到Excel中并获取索引错误: 我使用numpy大小来聚合一个Pandas DF，然后想使用writer.save将结果加载到Excel中。但是我收到以下错误： NotImplementedError：用MultiIndex写入Excel尚未实现。我的数据看起来像这样： agt_id unique_id abc123 ab12345 abc123 cd23456 abc123 de34567 xyz987 ef45678 xyz987 fg56789 我的结果应该是这样的： agt_id unique_id abc123 3 xyz987 2 这是我的代码的一个例子： df_agtvol = df_agt.groupby('agt_id').agg({'unique_id':[np.size]}) writer = pd.ExcelWriter(outfilepath, engine='xlsxwriter') df_agtvol.to_excel(writer, sheet_name='agt_vols') 我试图重置索引使用： df_agt_vol_final = df_agtvol.set_index([df_agtvol.index, 'agt_id'], inplace=True) 基于一些研究，但是得到一个完全不同的错误。我对Pandas数据框的工作相对比较陌生，所以任何帮助，将不胜感激。

处理“多单元格数组公式”的XLWings / Excel问题: 范围我明显地使用XLWings，从外部来源检索数据，在Python中进行一些转换，然后将其转换为Excel。我使用的是UDF（Windows 10，Excel 2016 32位）。我知道的唯一方法是使用“多单元格数组公式”将2维数据（Pandas数据框）添加到Excel工作表中。问题 “多单元arrays公式”似乎有多重限制，我还没有find一个解决scheme，如何：处理返回的数据框的dynamic大小（这是规则，而不是例外，请参阅我对github的评论）格式为表（不可能），以应用着色，sorting和过滤添加到datamodel（不可能）即join （还有什么不工作？）题其他人如何处理？

Python – 将数据格式化为Excel电子表格使用pandas: 我想要两列数据的团队名称和行。然而，我所有的input只是放在单元格B1中。（请注意，在我的代码片段底部注释掉了代码）。我想我需要循环遍历我的列表for循环，让所有的团队沿着A列，沿着B列向下，但只是用pandas来包裹我的头。任何帮助将不胜感激！谢谢 team = [] line = [] # Each row in table find all rows with class name team for tr in table.find_all("tr", class_="team"): # Place all text with identifier 'name' in list named team for td in tr.find_all("td", ["name"]): team.append(td.text.strip()) for tr in table.find_all("tr", class_="team"): for td in tr.find_all("td", […]

Python来遍历表和删除列: 我需要阅读一个Excel文件，并在每张纸上执行一些计算。基本上，如果列date不是“今天”，它需要删除行。到目前为止我得到了这个代码：导入date时间导入pandas作为PD ''' Parsing main excel sheet to save transactions != today's date ''' mainSource = pd.ExcelFile('path/to/file.xlsx') dfs = {sheet_name: mainSource.parse(sheet_name) for sheet_name in mainSource.sheet_names } for i in dfs: now = datetime.date.today(); dfs = dfs.drop(dfs.columns[6].dt.year != now, axis = 1); # It is the 6th column if datetime.time()<datetime.time(11,0,0,0): dfs.to_excel(r'path\to\outpt\test\'+str(i)+now+'H12.xlsx', index=False); #Save as […]

从excel空细胞到pandasdf: .read_excel() ，我试图使用.isin()但需要包含特定列的空单元格。数据如何被操纵？我读了它的NaN，但也发现NaN != NaN 。我如何访问空的Excel单元格？

用pandas获取df.to_excel（…）后的excel文件: 我正在使用Pyrebase将我的file upload到Firebase。我有一个DataFrame DF，并将其转换为Excel文件，如下所示： writer = ExcelWriter('results.xlsx') excelFile = df.to_excel(writer,'Sheet1') print(excelFile) # Save to firebase childRef = "path/to/results.xlsx" storage = firebase.storage() storage.child(childRef).put(excelFile) 但是，这将Excel文件存储为零个字节的Office电子表格。如果我运行writer.save()然后我得到适当的文件types（ xlsx ），但它存储在我的服务器（我想避免）。我如何才能生成正确的文件types，就像一个writer.save() ？注意： print(excelFile)返回None

用于Python技术指标的Excel xlwings数据input: 我想用xlwings复制一个简单的技术分析指标。但是，列表/数据似乎不能读取Excel值。下面是代码 import pandas as pd import datetime as dt import numpy as np @xw.func def EMA(df, n): EMA = pd.Series(pd.ewma(df['Close'], span = n, min_periods = n – 1), name = 'EMA_' + str(n)) df = df.join(EMA) return df 当我inputExcel数据列表：EMA =（{1,2,3,4,5}，5}，我得到以下错误消息TypeError：列表索引必须是整数，而不是str EMA = pd.Series（pd .ewma（df ['Close']，span = n，min_periods = n – 1），name ='EMA_'+ str（n）） […]

基于date的Python VLOOKUP – Pandas: 在pandas df中有一个问题，试图根据date获取“Count”列，代码应该在date列中search“date范围”，如果存在，则应将“Count”复制到“相应date的“post”列，例如：date_range value = 16/02/2017 – 代码在“date”列中search16/02/2017，并使“post”等于该date的“计数”值 – 如果date范围价值不出现 – 职位应= 0。数据示例： Dates Count date_range Posts 0 07/02/2017 1 16/12/2016 (should = 5) 1 01/03/2017 1 17/12/2016 2 15/02/2017 1 18/12/2016 3 23/01/2017 1 19/12/2016 4 28/02/2017 1 20/12/2016 5 09/02/2017 2 21/12/2016 6 20/03/2017 2 22/12/2016 7 16/12/2016 5 我的代码如下所示： DateList = df['Dates'].tolist() […]

在Python中运行多个OLS回归: 我需要运行大量的OLS回归（约1.600）。我已经为〜1.600个观测值中的每一个收集了60个数据点。我使用Fama＆French 5因子模型，每个观察的60个数据点与样本中的date相匹配。例如，我有一个数据框的开始date['2010-1-1']到结束date['2015-1-1']的五个因子参数。我需要针对给定股票的股票收益率运行这些参数。现在，由于五个因子参数被收集在一个数据框中，大约有96.000行（1600 * 60）和五列（对于每个因子），我需要select前60个观察值，用OLS对一组返回值进行运算，存储估计的系数，然后为因子参数和股票收益select接下来的 60个观测值。我曾尝试使用切片，如： start = 0 stop = 59 empty_list = [] for i in my_data: coef = my_date[i][start:stop] # run regression with the coef slice and store them in a dataframe start += 60 stop += 60 但是，我似乎无法得到这个工作。任何build议如何解决这个问题？

按列Python合并不同大小的表: 我有两个这样的表格： Table A: id id2 value 1 1 a 1 2 b 2 1 c 3 1 d Table B: id value2 1 e 2 g 3 h 我需要join他们，所以我得到这样的事情： Table needed: id id2 value value2 1 1 ae 1 2 be 2 1 cg 3 1 dh Excel或Python或R将工作。事实是，我需要，如果表A中的ID匹配表B中的，表B中的值被添加到匹配行（S）。尽pipe如此，两个表的大小都不一样，有时候表b中的id也不存在于表a中。我只需要表格a中的那个。