Tag: 数据框

使用python删除数据框中的零个值

嗨大家我需要一些帮助python。 我正在处理一个excel与几行,这些行的一些在所有列中的值为零,所以我需要删除那些行。 In id abcda 0 1 5 0 b 0 0 0 0 c 0 0 0 0 d 0 0 0 1 e 1 0 0 1 Out id abcda 0 1 5 0 d 0 0 0 1 e 1 0 0 1 我认为在类似的东西显示不包含零的行,但不工作,因为是删除所有行零和零 path = '/Users/arronteb/Desktop/excel/ejemplo1.xlsx' xlsx = pd.ExcelFile(path) df = […]

pandas:如何指定起始行提取数据

我正在使用Pandas库和Python。 我有一个Excel文件,在Excel工作表顶部有一些标题信息,我不需要进行数据提取。 但是,标题信息可能需要更长的行,所以不可预测的时间可能会多长。 所以,我的数据提取应该从它所说的“ID”开始……对于这个特殊情况,它从第5行开始,但是它可能会改变。 图像显示在底部(我在第5行灰色显示敏感信息)。 我如何把这个逻辑(跳过标题和跳转到第5行)? 模式应该是,行标题从“ID,EMP_ID”开始。 with open('File.xls') as fp: skip = next(filter( lambda x: x.startswith('ID'), enumerate(fp) ))[0] df = pd.read_excel('File.xls', usercols=['ID', 'EMP_ID'], skiprows=skip) print df

通过导出Pythonpandas数据框replace部分工作表

我有一个build立的Excel工作表,现在我想通过直接使用Python的结果来更新一些工作表。 B2:D12 in sheet "hey" in eg.xlsx , B2:D12 in sheet "hey" in eg.xlsx的区域是B2:D12 in sheet "hey" in eg.xlsx ,我已经具有pandas数据框(例如A)所需的数据。 现在我想用Python中的A代替B2:D12值,并保持原始格式。 我正在写这样的东西: with pd.ExcelWriter('eg.xlsx') as writer: A.to_excel(writer,sheet_name = 'hey',index = False,startcol = 1,startrow = 1) 但是,无论工作簿有多大,结果只是一个普通的工作簿,只有一个工作表名叫“hey”,而在Python中是一个默认的格式。 任何人都知道如何保持一切,但只是用我所拥有的数据框来replace这个特定的区域? 首先十分感谢! PS。 我也试过xlrd和xlwt(根本就不复杂),但是1)我不知道如何编写整个数据框,从一个单元格开始(比如B2),2)如何在Excel中保留原始格式? 3)我不能参考表格名称,只能参考表格序列。 import xlrd,xlwt from xlutils.copy import copy rb = xlrd.open_workbook('eg.xlsx') wb = copy(rb) ws = […]

链接数据框和Excel数据

我正在尝试为模拟创build一些参数,但是我正努力将所有的数据放在一起。 我的数据来自: df1 = pd.read_csv(file1) TurnDatabase = tkFileDialog.askopenfilename(title='choose file') 然后从不重要的数据中挑选一圈。 我遇到的麻烦是当我试图从CSV文件中获取数据时 'BCornerEntry' == 'YES' 而excel表单中的'sLap'与CSV相同。 Excel文档有这样一个表格: 打开数字,input,退出 1 321 546 2 789 1002 3 1230 1567 等等。 入口和出口在某一点上与sLap相同。 我有 我用这个来隔离轨道的边angular以及条件是否正确。 Entries1 = {i: df1.TurnData1[i][(df1.TurnData1[i]['BCornerEntry'] == "YES") & (df1.TurnData1[i]['NLap'] == Lap1)] for i in df1.TurnData1.viewkeys()} TurnData1来自这里: TurnInfo = TurnInfo.dropna(axis=1) # Split the data up into each […]

使用大pandas读取excel时精度的损失

我试图使用pandas来读取一个dataframe的Excel表格,但浮点列,数据读取不正确。 我使用函数read_excel()来完成这个任务 在excel中,值为225789.479905466,而在数据框中,值为225789.47990546614,这导致我从excel导入数据到数据库的差异。 有没有人用pandas.read_exel()面临同样的问题。 阅读csv到数据框我没有问题。 杰里米

我如何使用.xls文件夹和一系列variables名称自动创buildPandas数据框?

我有一个文件夹的文件数量。 我想导入工作表'sheet1'作为一个pandas数据框为他们每个人,分配给该名称的一部分的名称。 我已经成功地获得了一个文件名列表: path = "/Users/path" files = os.listdir(path) files_xls = [f for f in files if f[-3:] == 'xls'] ['A.xls','B.xls'] 我已经成功地创build了一个我希望作为数据框名称的名称列表: names = map(lambda each:each.strip(".xls"), files_xls) ['A','B'] 但是我没有使用这些名称导入。 我可以手动做到这一点: A = pd.read_excel(A.xls, 'sheet1') B = pd.read_excel(B.xls, 'sheet1') etc… 但我不知道如何自动化这个过程。

Pythonpandas读取来自同一张Excel表格的各种数据框

目前与大pandas,我可以保存各种数据框(不同大小)到同一张Excel表,用startrow和startcol来指定​​位置。 with pd.ExcelWriter(dump_excel) as writer: dataframe1.to_excel(writer, sheet_name='sheet1', startrow=40, startcol=0) dataframe2.to_excel(writer, sheet_name='sheet1', startrow=0, startcol=0) dataframe3.to_excel(writer, sheet_name='sheet2', startrow=0, startcol=0) 我想知道,如果我可以分别读取各种dataframe1和dataframe2。

pandas数据框:保存并读取Excel表格| 将整数作为string处理

我有一个pandas数据框(df)。 df有很多列和行,其中很多是整数。 我的意图是将数据框保存为excel文件,并在保持数据完整性的同时再次读取。 我正在使用以下步骤。 保存到excel中: writer = pd.ExcelWriter("myExcelFile.xlsx") df.to_excel(writer, 'sheet_name') writer.save() 从excel中读取: import glob files = glob.glob("myExcelFile*.xlsx") #gives list of files myFile = files[0] df = pd.read_excel(myFile , sheetname='sheet_name', convert_float=True) 请注意选项“ convert_float ”。 据说,excel以浮点格式保存所有数字。 所以这个选项应该有助于将所有的浮点值转换为可能的整数。 例如,1.0 – > 1。 我的要求是获取我打算保存在Excel表格中的原始整数值,并在稍后检索。 但是,这不起作用的原因。 我在哪里错了? 有没有办法,我可以处理,在保存到Excel中? 我试图解决这个问题,通过将整数变为string,在Excel中存储string,从Excel中读取string,重新转换为整数。 但是,我和我的应用程序的痛苦是太严重: – /

如何将xls中的所有字段作为string导入pandas数据框?

我正在尝试从xlsx导入一个文件到一个Python Pandas数据框。 我想阻止字段/列被解释为整数,从而失去前导零或其他所需的异构格式。 所以对于一个有100列的Excel工作表,我会用范围(99)的dict理解来做下面的事情。 import pandas as pd filename = 'C:\DemoFile.xlsx' fields = {col: str for col in range(99)} df = pd.read_excel(filename, sheetname=0, converters=fields) 这些导入文件始终有不同数量的列,我正在寻找处理这种方式,而不是一直手动更改范围。 有人有任何进一步的build议或替代Excel文件读取到一个数据框,默认情况下所有字段视为string? 非常感谢!

我可以确保单元格是使用Pandas Xlsxwriter写入date或时间格式吗?

我正在使用Pandas Xlsxwriter将文件创build时间写入Excel表格,但是我无法find我可以指定单元格格式的位置。 因此,我的时间戳以Excel中的文本forms出现 这是我的代码的相关部分 for d, dirs, files in os.walk(folder): for f in files: full_name = path.join(d, f) if path.isfile(full_name): time_info = [(fn(full_name)) for fn in (path.getatime, path.getmtime, path.getctime)] dict1 = [datetime.fromtimestamp(time_info[0]).strftime('%d.%m.%Y %H:%M:%S'), datetime.fromtimestamp(time_info[0]).strftime('%d.%m.%Y %H:%M:%S')] dict2.append(dict1) df = pd.DataFrame(dict2, columns=('the last access time', 'time changes') writer = pd.ExcelWriter('listdir1.xlsx', engine='xlsxwriter', datetime_format='dd.mm.yyyy', date_format='dd.mm.yyyy') df.to_excel(writer, index=False) writer.save() 这是它在Excel中的外观