Tag: 数据框

使用python删除数据框中的零个值: 嗨大家我需要一些帮助python。我正在处理一个excel与几行，这些行的一些在所有列中的值为零，所以我需要删除那些行。 In id abcda 0 1 5 0 b 0 0 0 0 c 0 0 0 0 d 0 0 0 1 e 1 0 0 1 Out id abcda 0 1 5 0 d 0 0 0 1 e 1 0 0 1 我认为在类似的东西显示不包含零的行，但不工作，因为是删除所有行零和零 path = '/Users/arronteb/Desktop/excel/ejemplo1.xlsx' xlsx = pd.ExcelFile(path) df = […]

pandas：如何指定起始行提取数据: 我正在使用Pandas库和Python。我有一个Excel文件，在Excel工作表顶部有一些标题信息，我不需要进行数据提取。但是，标题信息可能需要更长的行，所以不可预测的时间可能会多长。所以，我的数据提取应该从它所说的“ID”开始……对于这个特殊情况，它从第5行开始，但是它可能会改变。图像显示在底部（我在第5行灰色显示敏感信息）。我如何把这个逻辑（跳过标题和跳转到第5行）？模式应该是，行标题从“ID，EMP_ID”开始。 with open('File.xls') as fp: skip = next(filter( lambda x: x.startswith('ID'), enumerate(fp) ))[0] df = pd.read_excel('File.xls', usercols=['ID', 'EMP_ID'], skiprows=skip) print df

通过导出Pythonpandas数据框replace部分工作表: 我有一个build立的Excel工作表，现在我想通过直接使用Python的结果来更新一些工作表。 B2:D12 in sheet "hey" in eg.xlsx ， B2:D12 in sheet "hey" in eg.xlsx的区域是B2:D12 in sheet "hey" in eg.xlsx ，我已经具有pandas数据框（例如A）所需的数据。现在我想用Python中的A代替B2:D12值，并保持原始格式。我正在写这样的东西： with pd.ExcelWriter('eg.xlsx') as writer: A.to_excel(writer,sheet_name = 'hey',index = False,startcol = 1,startrow = 1) 但是，无论工作簿有多大，结果只是一个普通的工作簿，只有一个工作表名叫“hey”，而在Python中是一个默认的格式。任何人都知道如何保持一切，但只是用我所拥有的数据框来replace这个特定的区域？首先十分感谢！ PS。我也试过xlrd和xlwt（根本就不复杂），但是1）我不知道如何编写整个数据框，从一个单元格开始（比如B2），2）如何在Excel中保留原始格式？ 3）我不能参考表格名称，只能参考表格序列。 import xlrd,xlwt from xlutils.copy import copy rb = xlrd.open_workbook('eg.xlsx') wb = copy(rb) ws = […]

链接数据框和Excel数据: 我正在尝试为模拟创build一些参数，但是我正努力将所有的数据放在一起。我的数据来自： df1 = pd.read_csv(file1) TurnDatabase = tkFileDialog.askopenfilename(title='choose file') 然后从不重要的数据中挑选一圈。我遇到的麻烦是当我试图从CSV文件中获取数据时 'BCornerEntry' == 'YES' 而excel表单中的'sLap'与CSV相同。 Excel文档有这样一个表格：打开数字，input，退出 1 321 546 2 789 1002 3 1230 1567 等等。入口和出口在某一点上与sLap相同。我有我用这个来隔离轨道的边angular以及条件是否正确。 Entries1 = {i: df1.TurnData1[i][(df1.TurnData1[i]['BCornerEntry'] == "YES") & (df1.TurnData1[i]['NLap'] == Lap1)] for i in df1.TurnData1.viewkeys()} TurnData1来自这里： TurnInfo = TurnInfo.dropna(axis=1) # Split the data up into each […]

使用大pandas读取excel时精度的损失: 我试图使用pandas来读取一个dataframe的Excel表格，但浮点列，数据读取不正确。我使用函数read_excel（）来完成这个任务在excel中，值为225789.479905466，而在数据框中，值为225789.47990546614，这导致我从excel导入数据到数据库的差异。有没有人用pandas.read_exel（）面临同样的问题。阅读csv到数据框我没有问题。杰里米

我如何使用.xls文件夹和一系列variables名称自动创buildPandas数据框？: 我有一个文件夹的文件数量。我想导入工作表'sheet1'作为一个pandas数据框为他们每个人，分配给该名称的一部分的名称。我已经成功地获得了一个文件名列表： path = "/Users/path" files = os.listdir(path) files_xls = [f for f in files if f[-3:] == 'xls'] ['A.xls'，'B.xls'] 我已经成功地创build了一个我希望作为数据框名称的名称列表： names = map(lambda each:each.strip(".xls"), files_xls) ['A'，'B'] 但是我没有使用这些名称导入。我可以手动做到这一点： A = pd.read_excel(A.xls, 'sheet1') B = pd.read_excel(B.xls, 'sheet1') etc… 但我不知道如何自动化这个过程。

Pythonpandas读取来自同一张Excel表格的各种数据框: 目前与大pandas，我可以保存各种数据框（不同大小）到同一张Excel表，用startrow和startcol来指定位置。 with pd.ExcelWriter(dump_excel) as writer: dataframe1.to_excel(writer, sheet_name='sheet1', startrow=40, startcol=0) dataframe2.to_excel(writer, sheet_name='sheet1', startrow=0, startcol=0) dataframe3.to_excel(writer, sheet_name='sheet2', startrow=0, startcol=0) 我想知道，如果我可以分别读取各种dataframe1和dataframe2。

pandas数据框：保存并读取Excel表格| 将整数作为string处理: 我有一个pandas数据框（df）。 df有很多列和行，其中很多是整数。我的意图是将数据框保存为excel文件，并在保持数据完整性的同时再次读取。我正在使用以下步骤。保存到excel中： writer = pd.ExcelWriter("myExcelFile.xlsx") df.to_excel(writer, 'sheet_name') writer.save() 从excel中读取： import glob files = glob.glob("myExcelFile*.xlsx") #gives list of files myFile = files[0] df = pd.read_excel(myFile , sheetname='sheet_name', convert_float=True) 请注意选项“ convert_float ”。据说，excel以浮点格式保存所有数字。所以这个选项应该有助于将所有的浮点值转换为可能的整数。例如，1.0 – > 1。我的要求是获取我打算保存在Excel表格中的原始整数值，并在稍后检索。但是，这不起作用的原因。我在哪里错了？有没有办法，我可以处理，在保存到Excel中？我试图解决这个问题，通过将整数变为string，在Excel中存储string，从Excel中读取string，重新转换为整数。但是，我和我的应用程序的痛苦是太严重： – /

如何将xls中的所有字段作为string导入pandas数据框？: 我正在尝试从xlsx导入一个文件到一个Python Pandas数据框。我想阻止字段/列被解释为整数，从而失去前导零或其他所需的异构格式。所以对于一个有100列的Excel工作表，我会用范围（99）的dict理解来做下面的事情。 import pandas as pd filename = 'C:\DemoFile.xlsx' fields = {col: str for col in range(99)} df = pd.read_excel(filename, sheetname=0, converters=fields) 这些导入文件始终有不同数量的列，我正在寻找处理这种方式，而不是一直手动更改范围。有人有任何进一步的build议或替代Excel文件读取到一个数据框，默认情况下所有字段视为string？非常感谢！

我可以确保单元格是使用Pandas Xlsxwriter写入date或时间格式吗？: 我正在使用Pandas Xlsxwriter将文件创build时间写入Excel表格，但是我无法find我可以指定单元格格式的位置。因此，我的时间戳以Excel中的文本forms出现这是我的代码的相关部分 for d, dirs, files in os.walk(folder): for f in files: full_name = path.join(d, f) if path.isfile(full_name): time_info = [(fn(full_name)) for fn in (path.getatime, path.getmtime, path.getctime)] dict1 = [datetime.fromtimestamp(time_info[0]).strftime('%d.%m.%Y %H:%M:%S'), datetime.fromtimestamp(time_info[0]).strftime('%d.%m.%Y %H:%M:%S')] dict2.append(dict1) df = pd.DataFrame(dict2, columns=('the last access time', 'time changes') writer = pd.ExcelWriter('listdir1.xlsx', engine='xlsxwriter', datetime_format='dd.mm.yyyy', date_format='dd.mm.yyyy') df.to_excel(writer, index=False) writer.save() 这是它在Excel中的外观