Tag: pandas

用Pandas从函数返回多个DataFrame

我试图parsing多个Excel与pandas分为单独的个人数据框。 我的代码到目前为止是: sheet_names =[tab1, tab2] df_names = [1,2] def initilize_dataframes(sheet_names): for name in sheet_names: df = xls_file.parse(name) #parse the xlxs sheet df = df.transpose() #transpose dates to index new_header = df.iloc[0] #column header names df = df[1:] #drop 1st row df.rename(columns=new_header, inplace= True) #rename the columns return df` ` for i in df_names: df_(i) = […]

Python 3 – 从构造的Dictionary中使用pandas写入excel

你好,Pythonic爱好者。 我遇到了一个相当有趣的小问题,由于缺乏经验,我无法解决。 我正在基于一组图表数据库中的答案构build一个字典,我已经遇到了一个有趣的困境。 (我正在运行Python 3 当所有的事情都说完之后,我会在excel文件中得到如下的输出示例(这是从第0列开始的,每一行都是一行: 实际表格格式: 0/{'RecordNo': 0} 1/{'Dept': 'DeptName'} 2/{'Option 1': 'Option1Value'} 3/{'Option 2': 'Option2Value'} 4/{'Question1': 'Answer1'} 5/{'Question2': 'Answer2'} 6/{'Question3': 'Answer3'} 等等.. 预期的EXCEL格式: 0/Dept, Option 1, Option 2, Question 1, Question 2, Question 3 1/DeptName, Option1Value, Option2Value, Answer1, Answer2, Answer3 字典的键应该是标题和值,每一行的内容,但是由于某种原因,当我使用下面的输出代码时,它将它写出来作为键和值: EXCEL作者代码: ReportDF = pd.DataFrame.from_dict(DomainDict) WriteMe = pd.ExcelWriter('Filname.xlsx') ReportDF.to_excel(WriteMe, 'Sheet1') try: WriteMe.save() print('Save […]

如何读取gzip格式的文本文件,而不解压缩使用python写入该行excel?

问题陈述:我有一个包含gzip文件的目录,每个gzip文件都包含一个文本文件。 我已经写了一个代码,它解压所有的gzip文件,然后用于读取每个解压缩的文本文件,然后将该输出结合到一个文本文件,然后应用一个条件,如果条件符合,然后写入Excel。 上面的过程有点乏味和冗长。 任何人都可以帮助我写出代码,直接从txt文件中读取数据,并将其写入excel。

Pythonpandas如何在Excel中写入数据

我不能在Excel中写入数据。 在DataFrame()指定函数需要哪些参数? import pandas as pd table = pd.read_excel("file1.xlsx", sheetname="file1") lastval = table['lastval'].values.tolist() newval = table['newval'].values.tolist() rm = table['rm'].values.tolist() itog = [0, 0, 0] for i in range(3): itog[i] = (newval[i]-lastval[i]) * rm[i] pd.DataFrame(?????)

pandas无法打开这个Excel文件

我正在尝试使用pythonpandas打开一个Excel文件。 代码很简单,如下所示; import pandas as pd df = pd.read_excel('../TestXLWings.xlsm', sheetname="TestSheet") 我下面有一个错误; Traceback (most recent call last): File "C:\Program Files\JetBrains\PyCharm Community Edition 2017.2\helpers\pydev\pydevd.py", line 1599, in <module> globals = debugger.run(setup['file'], None, None, is_module) File "C:\Program Files\JetBrains\PyCharm Community Edition 2017.2\helpers\pydev\pydevd.py", line 1026, in run pydev_imports.execfile(file, globals, locals) # execute the script File "C:\Program Files\JetBrains\PyCharm Community Edition 2017.2\helpers\pydev\_pydev_imps\_pydev_execfile.py", […]

将.txt写入Python中的.csv excel列

我有一个相当大的文本文件与多列,我必须转换为15列.csv文件在Excel中读取。 parsing我需要的字段的逻辑写在下面,但是我很难写入.csv。 columns = [ 'TRANSACTN_NBR', 'RECORD_NBR', 'SEQUENCE_OR_PIC_NBR', 'CR_DB', 'RT_NBR', 'ACCOUNT_NBR', 'RSN_COD', 'ITEM_AMOUNT', 'ITEM_SERIAL', 'CHN_IND', 'REASON_DESCR', 'SEQ2', 'ARCHIVE_DATE', 'ARCHIVE_TIME', 'ON_US_IND' ] for line in in_file: values = line.split() if 'PRINT DATE:' in line: dtevalue = line.split(a,1)[-1].split(b)[0] lines.append(dtevalue) elif 'PRINT TIME:' in line: timevalue = line.split(c,1)[-1].split(b)[0] lines.append(timevalue) elif (len(values) >= 4 and values[3] == 'C' and […]

Concat 2使用Python将excel文件转换为新的excel文件

Excel文件1: ColumnA ColumnB ColumnC 1. ice Chicken 2. ice Butter 3. ice Mutton 4. fire Spinach 5. fire Beef 6. fire Cucumber 7. fire Egg Excel文件2: ColumnA ColumnB ice Mutton fire Egg 我有2个Excel文件。 使用python我想将两个excel文件结合在一起看起来像这样: ColumnA ColumnB ColumnC ColumnD 1. ice Chicken Mutton 2. ice Butter Mutton 3. ice Mutton Mutton 4. fire Spinach Egg 5. […]

XLRD错误通过pandas

当我尝试pd.read_excel()时出现以下错误。 这个错误是特定于我的电脑的:当我在不同的计算机上使用相同的文件运行脚本时,不会发生错误。 Python 3.6.1的Anaconda发行版。 pandas版本'0.20.3' ,Xlrd版本'1.1.0' : XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\x08jstanle' XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\x08jstanle'是我的电脑名称,所以这可能是一个很大的暗示,我错过了。 它试图打开.xls或.xlsx文件。 我试过改变扩展到旧的和新版本的Excel没有任何改变。 谢谢您的帮助! 我会把下面的完整错误的位。 C:\Users\jstanley\Documents\—-\—\Python\load_data_original.py in load_(exp_id, file_path) 60 61 def load_(exp_id, file_path): —> 62 dict_sheets = pd.read_excel(file_path, header=None, sheetname=None) 63 new_dict_sheets = dict() 64 C:\Users\jstanley\Anaconda3\lib\site-packages\pandas\io\excel.py […]

使用pandas基于COUNTIF()的单独的Excel表build立一个二维表

我想build立一个基于值(和countifs)从另一个表的二维表。 我设法成功地使用Excel原型,但是我坚持两个概念: 1. Emulating Excel COUNTIF() on pandas 2. Dynamically build a new dataframe 注意:COUNTIF()将范围和标准作为参数。 例如,如果我有一个颜色列表,我想知道下面的列表中的“橙色”的次数: A Red Orange Blue Orange Black ,那么我会简单地使用下面的公式: COUNTIF(A1:A5, "Orange") 这应该返回2。 当然,COUNTIF()函数可以变得更加复杂,比如COUNTIF(range1,criterion1,range2,criterion2 …)这种forms的表单连接条件可以被解释为一个AND标准。 例如,如果我想在类似于下面的列表中计算35岁以上的女性: AB Female 19 Female 40 Male 45 ,那么我会简单地使用下面的公式: COUNTIF(A1:A3, "Female", B1:B3, ">35" 这应该返回1。 回到我的用例。 这是源表: Product No Opening Date Closing Date Opening Month Closing Month 0 […]

查找不在一组值中的行(与SQL Except类似)

我想要做的是删除Excel文件的几行(与pandas),然后将文件没有这些行保存到.xlsx(与pyexcelerate模块)。 我知道我可以删除数据框的行(我已经得到这个工作)。 但是我已经阅读了几篇文章,当有很多(在我的情况下> 5000)行应该被删除,只是从数据框中获得“删除”行的索引,然后切片dataframe就像例如SQL Except语句那样)。 不幸的是我不能得到它的工作,即使我已经尝试了几种方法。 这里是我的“源文章”: 通过不在列表中的标签切片pandas数据框 – 从用户ASGM答复 如何从pandas数据框中删除行列表? – 用户Dennis Golomazov的回答 这里是函数的一部分,它应该删除行并保存创build的文件: for index, cell in enumerate(wb_in[header_xlsx]): if str(cell) in delete_set: set_to_delete.append(index) print str(cell) + " deleted from set: " + str(len(set_to_delete)) wb_out = Workbook() data_out = wb_in.loc[set(wb_in.index) – set(set_to_delete)] ws_out = wb_out.new_sheet('Main', data=data_out) wb_out.save(file_path + filename + "_2.xlsx") 这里是一个数据框的例子: sku product_group […]