Tag: python

使用python删除数据框中的零个值: 嗨大家我需要一些帮助python。我正在处理一个excel与几行，这些行的一些在所有列中的值为零，所以我需要删除那些行。 In id abcda 0 1 5 0 b 0 0 0 0 c 0 0 0 0 d 0 0 0 1 e 1 0 0 1 Out id abcda 0 1 5 0 d 0 0 0 1 e 1 0 0 1 我认为在类似的东西显示不包含零的行，但不工作，因为是删除所有行零和零 path = '/Users/arronteb/Desktop/excel/ejemplo1.xlsx' xlsx = pd.ExcelFile(path) df = […]

用于导入和生成Excel文档的Django / Python库？: 寻找具有特定要求的Django和Python的Excel库。看起来有许多Django和Python的库，使用户能够将Excel文档上传到数据库中。我想知道的是，如果有一个库，允许您创build一个Excel文档和导出条件格式，现场公式，创build标签和VLOOKUPS？我工作的公司生产Excel报告供我们的分析师审查，需要这些types的东西。研究，因为我们正在探索其他解决scheme，而不是使用Access，这是很容易控制Excel的。

如何避免覆盖xlsxwriter（Python）中的单元格样式格式？: 我在Python 2.7 ，xlsxwriter 0.8.4 。我有一个值列表， int s和float s，我希望能够应用不同的数字格式时，将数据写入工作表的单元格。但是，使用set_num_format方法时，最后应用的格式将应用于已经写入的单元格。我想知道是否可以单独为每个写入操作应用单元格格式？如果不是，那么如何pipe理多个格式化对象，而不用像以下那样进行硬编码： simple_style_percent_int = workbook.add_format({'bold': False, 'font_color': 'black','font_size': 11, 'font_name': 'Calibri','text_wrap': True, 'num_format': '0"%"'}) simple_style_percent_decimal = workbook.add_format({'bold': False, 'font_color': 'black','font_size': 11, 'font_name': 'Calibri','text_wrap': True, 'num_format': '0.0"%"'}) 我运行的代码是： import xlsxwriter workbook = xlsxwriter.Workbook('test.xlsx') worksheet = workbook.add_worksheet() percent_format = workbook.add_format() for item in [22.0, 34.68]: if […]

pandas，Python的输出问题: 开始代码 import pandas as pd df = pd.read_csv('C:/Users/lhicks/Documents/Corporate/test.csv', 'r') saved_column = df.FirstName saved_column2 = df.LastName saved_column3 = df.Email print saved_column print saved_column2 print saved_column3 Itemlist = [] Itemlist.append(saved_column) print Itemlist 代码结束其目标是从指定的xls表单中select特定的列，从指定的列中获取所有行，然后将该数据输出。目前的问题是数据被正确抓取，但在29-30行之后，它打印/存储“…”，然后跳转到行项目880s，并从那里结束。另一个问题是，它也将这个值存储为值，由于没有提供完整的数据集而使其变得毫无价值。最终的过程是将选定的列添加到一个新的xls表来清理旧的数据，然后将行添加到模板化文档以生成广告信。第一个问题是如何填充所有的字段？其次是什么是最好的办法呢？如果可能，请提供其他链接，这对我来说是一个实际的学习经验。

删除pandas标签: 我想通过python插入一些excel文件列中的数据。我正在使用pandas在现有的Excel文件中插入和写入数据。 41 5 5 40 96 5 25 5 3 12 6 29 但它扰乱了整个结构并删除了一些数据。 41 0 5 5 0 10 96 5 1 20 5 3 2 30 6 29 3 20 4 15 5 30 6 45 我只想插入我的数据没有antdatalabels。这是我的代码： import pandas as pd import win32com.client xlApp = win32com.client.Dispatch("Excel.Application") wkbk = xlApp.Workbooks.Open("D:\PycharmProjects\\untitled1\\arrays.xlsx") wksht = […]

pandas：如何指定起始行提取数据: 我正在使用Pandas库和Python。我有一个Excel文件，在Excel工作表顶部有一些标题信息，我不需要进行数据提取。但是，标题信息可能需要更长的行，所以不可预测的时间可能会多长。所以，我的数据提取应该从它所说的“ID”开始……对于这个特殊情况，它从第5行开始，但是它可能会改变。图像显示在底部（我在第5行灰色显示敏感信息）。我如何把这个逻辑（跳过标题和跳转到第5行）？模式应该是，行标题从“ID，EMP_ID”开始。 with open('File.xls') as fp: skip = next(filter( lambda x: x.startswith('ID'), enumerate(fp) ))[0] df = pd.read_excel('File.xls', usercols=['ID', 'EMP_ID'], skiprows=skip) print df

编写头文件在Excel中的Excel文件: 你如何循环列表中的每个元素，并把它作为excel头？让我知道是否有重复的问题。我目前还找不到。 row=0 col=0 j = 0 title = ['No.', 'Hue', 'Saturation', 'Value', 'Lightness', 'AComponent', 'BComponent', 'Blue Channel', 'Green Channel', 'Red Channel'] for i in title[0:len(title)]: worksheet.write(row + 1, col + j, 'title[%i]', bold) j += 1 我想做一些像红色的文字

drop_duplicates不工作在pandas？: 我的代码的目的是导入2 Excel文件，比较它们，并打印出一个新的Excel文件的差异。但是，在连接所有数据并使用drop_duplicates函数后，代码将被控制台接受。但是，当打印到新的excel文件，重复仍然在一天之内。我错过了什么吗？是drop_duplicatesfunction的东西？我的代码如下： import datetime import xlrd import pandas as pd #identify excel file paths filepath = r"excel filepath" filepath2 = r"excel filepath2" #read relevant columns from the excel files df1 = pd.read_excel(filepath, sheetname="Sheet1", parse_cols= "B, D, G, O") df2 = pd.read_excel(filepath2, sheetname="Sheet1", parse_cols= "B, D, F, J") #merge the columns […]

使用python win32添加评论到excel: 我正在尝试添加新的评论，以使用Win32的python擅长。 import win32com.client as win32 excel = win32.gencache.EnsureDispatch('Excel.Application') wb = excel.Workbooks.Open(r'C:\…\.xlsx') ws = wb.Worksheets('sheet1') ws.Cells(1,1).AddComment = "comment" – >对象没有属性'AddComment' 你知道如何添加新的评论，以使用Win32的Excel吗？谢谢！

试图合并到一个数据框，但它不断创build新的列: 我试图打开文件，并从多个电子表格派生2列（每行1），然后将它们合并到一个基础电子表格。所以，基础数据框（从电子表格中，我只需要3列）是这样的： Model | Roadmap | Family a 08/12/17 ROW b 08/14/17 MACRO c 08/15/17 CONN d 08/27/17 MACRO 来自多个电子表格的数据框（模型名称是电子表格名称，它们具有多个dataframe中的每个门的多个date），并具有以下格式： df1 (part1 – the dataframe derived from the spreadsheet with model a for gate 0 ): Model | Gate 0 a 02/01/18 df1 (Dataframe derived from the spreadsheet with model a for gate1): Model | Gate […]