Tag: pandas

如何摆脱行号,pd.read_excel?

我是一个Python初学者。 我正在做一个任务,我似乎无法弄清楚如何从我的Excel电子表格中删除行号 ,而使用import pandas 。 这是我运行代码时得到的结果: 0 $20,000,000 $159,000,000 1 $9,900,000 $35,600,000 2 $35,000,000 $45,000,000 3 $9,900,000 $35,600,000 4 $12,000,000 $9,400,000 但是,我只想要: $20,000,000 $159,000,000 $9,900,000 $35,600,000 $35,000,000 $45,000,000 $9,900,000 $35,600,000 $12,000,000 $9,400,000 这是我的主要格式的块内: if __name__ == "__main__": file_name = "movie_theme.xlsx" # Formatting numbers (eg $1,000,000) pd.options.display.float_format = '${:,.0f}'.format # Reading Excel file df = pd.read_excel(file_name, […]

pandasExcelFile.parse()读取文件在dict而不是数据框

我是新来的python,甚至更新的pandas,但相对精通R.我使用的是python,与Python 3.5和pandas0.18.1。 我想读取一个excel文件作为一个数据框。 该文件承认是相当…丑陋。 有很多空的空间,缺less标题等(我不知道这是否是任何问题的根源) 我创build文件对象,然后find适当的工作表,然后尝试读取该表作为数据框: xl = pd.ExcelFile(allFiles[i]) sName = [s for s in xl.sheet_names if 'security exposure' in s.lower()] df = xl.parse(sName) df 结果: {'Security exposure – 21 day lag': Percent of Total Holdings \ 0 KMNFC vs. 3 Month LIBOR AUD 1 04-OCT-16 2 Australian Dollar 3 NaN 4 NaN 5 NaN […]

pandas迭代行,然后打破,直到条件

我有一个这样没有组织的专栏。 Name Jack James Riddick Random value Another random value 我想要做的只是从这个列中获取名称,但努力寻找一种方法来区分真实姓名为随机值。 幸运的是名字都在一起,随机值也都在一起。 我可以做的唯一的事情是遍历行,直到它获得“随机值”,然后中断。 我试过使用lambda的这个,但没有成功,因为我不认为有办法打破。 而且我不确定在这种情况下理解能够起作用。 这是我一直在试图玩的例子。 df['Name'] = df['Name'].map(lambda x: True if x != 'Random value' else break) 但是,上述不起作用。 任何build议什么可以根据我想要实现的工作? 谢谢。

AttributeError:'str'对象没有属性'parse'

我正在学习Python,第一次尝试使用pandas。 我有一个目录,大约有50个excel工作簿,我试图将它们合并为一个。 import openpyxl import pandas as pd import numpy as np import glob import os import sys #path = "\\\\mtrjesmith\\Service Parts Photography Project\\STERISForms" files = os.listdir("\\\\mtrjesmith\\Service Parts Photography Project\\STERISForms") outf = "C:\\Python27\\Scripts\\steris_forms\\compiled.xls", "w+b" #print(files) frame = [x.parse(x.sheet_names[0], header=None,index_col=None) for x in files] frame[1:] = [df[1:] for df in frame[1:]] combined = pd.concat(frame) combined.to_excel("C:\\Python27\\Scripts\\steris_forms\\compiled.xls", "w+b", […]

在写一个pandasDataframe到Excel文件时遇到麻烦

我有一个Excel文件列表,我正在创build数据框。 我在数据框上执行一些任务,然后尝试将这些数据框写回到文件中(更像是完全replace它们)。 但我无法写入文件。 这是代码 for file in files: file_name = os.path.basename(file) table = pd.read_excel(file, 0) ## (Perform Operations here) writer = pd.ExcelWriter(file) df.to_excel(writer,'Sheet1') writer.save 现在,当我试图将文件读回pandas时,我得到这个错误 FileNotFoundError: [Errno 2] No such file or directory: 'test2.xlsx' 没有任何文件正在创build。 但是我无法知道我哪里错了。 另外writer.save返回 <bound method _XlsxWriter.save of <pandas.io.excel._XlsxWriter object at 0x000000000B9712E8>>

Python Pandas错误:pandas只能使用.str访问器和string值

我有一个pandas脚本,我得到一个Excel工作表,并把它放在一个pandas数据框,然后我在这个数据框中查找一个特定的单词,然后我创build一个1和0的df掩码,在那里我find了单词。 我没有Excel表格的特定格式,所以我得到所有的信息,我find了这个词,并创build一个与此行产生的错误的面具: mask = np.column_stack([df[col].str.find(word) for col in df.columns.tolist()]).astype(int) 这行有时会产生这个错误: pandas只能使用带string值的.str访问器,它使用pandas中的np.object_ dtype 任何想法为什么以及如何使其工作? 谢谢

将多个不同行的Excel文件合并到pandas的一个Excel文件中

我有4个Excel文件,我必须合并成一个Excel文件。 包含ID,姓名,年龄和性别的人口统计文件。 实验室文件包含ID,缩写testing名称,testingdate和testing值。 包含身份证,姓名缩写,身体状况,开始和停止date的医疗logging。 给药含有ID,姓名,药物名称,剂量,频率,开始和停止date。 有50个病人。 人口档案包含50个病人的全部50行。 其余的文件有50个病人,但在100到400行,因为每个病人有多个实验室testing或多种药物。 当我在大pandas合并时,我有错误的病人重复或分配实体。 我们面临的挑战是如果你的病人有比实验室更多的药物治疗,那么实验室检查应该用空格来替代重复的病人。 这是一个缩短的表示forms: import pandas as pd lab = pd.read_excel('data/data.xlsx', sheetname='lab') drugs = pd.read_excel('data/data.xlsx', sheetname='drugs') merged_data = pd.merge(drugs, lab, on='ID', how='left') merged_data.to_excel('merged_data.xls') 你得到这个结果: pandas合并结果 我更喜欢这个结果:首选输出

填充Pythonpandas数据框

我可以写一个常规的数据框,它具有行和列的值,但是不能find写入行的方法,例如method1,method2..etc,deterministic …。 而且,我也没有find一种方法来拆分一个列(例如,没有位| 4)。 这是一个单独的Excel文件,其中数据将被添加一段时间后。 任何帮助将不胜感激 :) 谢谢!

如何让大pandas在同一顺序在Excel中读取行?

一般来说,当我们将一个excel文件作为数据框导入pandas时,行的顺序与Excel表中的行顺序不同。 我希望数据框的行与Excel表中的行相同。

如何在pandas / python中查看Excel电子表格的公式?

我想阅读一个Excel电子表格python / pandas,但有公式,而不是单元格的结果。 例如,如果单元格A1是25,单元格B1是= A1,我想我的数据框显示: 25 =A1 现在它显示: 25 25 我怎么能这样做?