Tag: python

使用python删除数据框中的零个值

嗨大家我需要一些帮助python。 我正在处理一个excel与几行,这些行的一些在所有列中的值为零,所以我需要删除那些行。 In id abcda 0 1 5 0 b 0 0 0 0 c 0 0 0 0 d 0 0 0 1 e 1 0 0 1 Out id abcda 0 1 5 0 d 0 0 0 1 e 1 0 0 1 我认为在类似的东西显示不包含零的行,但不工作,因为是删除所有行零和零 path = '/Users/arronteb/Desktop/excel/ejemplo1.xlsx' xlsx = pd.ExcelFile(path) df = […]

用于导入和生成Excel文档的Django / Python库?

寻找具有特定要求的Django和Python的Excel库。 看起来有许多Django和Python的库,使用户能够将Excel文档上传到数据库中。 我想知道的是,如果有一个库,允许您创build一个Excel文档和导出条件格式,现场公式,创build标签和VLOOKUPS? 我工作的公司生产Excel报告供我们的分析师审查,需要这些types的东西。 研究,因为我们正在探索其他解决scheme,而不是使用Access,这是很容易控制Excel的。

如何避免覆盖xlsxwriter(Python)中的单元格样式格式?

我在Python 2.7 ,xlsxwriter 0.8.4 。 我有一个值列表, int s和float s,我希望能够应用不同的数字格式时,将数据写入工作表的单元格。 但是,使用set_num_format方法时,最后应用的格式将应用于已经写入的单元格。 我想知道是否可以单独为每个写入操作应用单元格格式? 如果不是,那么如何pipe理多个格式化对象,而不用像以下那样进行硬编码 : simple_style_percent_int = workbook.add_format({'bold': False, 'font_color': 'black','font_size': 11, 'font_name': 'Calibri','text_wrap': True, 'num_format': '0"%"'}) simple_style_percent_decimal = workbook.add_format({'bold': False, 'font_color': 'black','font_size': 11, 'font_name': 'Calibri','text_wrap': True, 'num_format': '0.0"%"'}) 我运行的代码是: import xlsxwriter workbook = xlsxwriter.Workbook('test.xlsx') worksheet = workbook.add_worksheet() percent_format = workbook.add_format() for item in [22.0, 34.68]: if […]

pandas,Python的输出问题

开始代码 import pandas as pd df = pd.read_csv('C:/Users/lhicks/Documents/Corporate/test.csv', 'r') saved_column = df.FirstName saved_column2 = df.LastName saved_column3 = df.Email print saved_column print saved_column2 print saved_column3 Itemlist = [] Itemlist.append(saved_column) print Itemlist 代码结束 其目标是从指定的xls表单中select特定的列,从指定的列中获取所有行,然后将该数据输出。 目前的问题是数据被正确抓取,但在29-30行之后,它打印/存储“…”,然后跳转到行项目880s,并从那里结束。 另一个问题是,它也将这个值存储为值,由于没有提供完整的数据集而使其变得毫无价值。 最终的过程是将选定的列添加到一个新的xls表来清理旧的数据,然后将行添加到模板化文档以生成广告信。 第一个问题是如何填充所有的字段? 其次是什么是最好的办法呢? 如果可能,请提供其他链接,这对我来说是一个实际的学习经验。

删除pandas标签

我想通过python插入一些excel文件列中的数据。 我正在使用pandas在现有的Excel文件中插入和写入数据。 41 5 5 40 96 5 25 5 3 12 6 29 但它扰乱了整个结构并删除了一些数据。 41 0 5 5 0 10 96 5 1 20 5 3 2 30 6 29 3 20 4 15 5 30 6 45 我只想插入我的数据没有antdatalabels。 这是我的代码: import pandas as pd import win32com.client xlApp = win32com.client.Dispatch("Excel.Application") wkbk = xlApp.Workbooks.Open("D:\PycharmProjects\\untitled1\\arrays.xlsx") wksht = […]

pandas:如何指定起始行提取数据

我正在使用Pandas库和Python。 我有一个Excel文件,在Excel工作表顶部有一些标题信息,我不需要进行数据提取。 但是,标题信息可能需要更长的行,所以不可预测的时间可能会多长。 所以,我的数据提取应该从它所说的“ID”开始……对于这个特殊情况,它从第5行开始,但是它可能会改变。 图像显示在底部(我在第5行灰色显示敏感信息)。 我如何把这个逻辑(跳过标题和跳转到第5行)? 模式应该是,行标题从“ID,EMP_ID”开始。 with open('File.xls') as fp: skip = next(filter( lambda x: x.startswith('ID'), enumerate(fp) ))[0] df = pd.read_excel('File.xls', usercols=['ID', 'EMP_ID'], skiprows=skip) print df

编写头文件在Excel中的Excel文件

你如何循环列表中的每个元素,并把它作为excel头? 让我知道是否有重复的问题。 我目前还找不到。 row=0 col=0 j = 0 title = ['No.', 'Hue', 'Saturation', 'Value', 'Lightness', 'AComponent', 'BComponent', 'Blue Channel', 'Green Channel', 'Red Channel'] for i in title[0:len(title)]: worksheet.write(row + 1, col + j, 'title[%i]', bold) j += 1 我想做一些像红色的文字

drop_duplicates不工作在pandas?

我的代码的目的是导入2 Excel文件,比较它们,并打印出一个新的Excel文件的差异。 但是,在连接所有数据并使用drop_duplicates函数后,代码将被控制台接受。 但是,当打印到新的excel文件,重复仍然在一天之内。 我错过了什么吗? 是drop_duplicatesfunction的东西? 我的代码如下: import datetime import xlrd import pandas as pd #identify excel file paths filepath = r"excel filepath" filepath2 = r"excel filepath2" #read relevant columns from the excel files df1 = pd.read_excel(filepath, sheetname="Sheet1", parse_cols= "B, D, G, O") df2 = pd.read_excel(filepath2, sheetname="Sheet1", parse_cols= "B, D, F, J") #merge the columns […]

使用python win32添加评论到excel

我正在尝试添加新的评论,以使用Win32的python擅长。 import win32com.client as win32 excel = win32.gencache.EnsureDispatch('Excel.Application') wb = excel.Workbooks.Open(r'C:\…\.xlsx') ws = wb.Worksheets('sheet1') ws.Cells(1,1).AddComment = "comment" – >对象没有属性'AddComment' 你知道如何添加新的评论,以使用Win32的Excel吗? 谢谢!

试图合并到一个数据框,但它不断创build新的列

我试图打开文件,并从多个电子表格派生2列(每行1),然后将它们合并到一个基础电子表格。所以,基础数据框(从电子表格中,我只需要3列)是这样的: Model | Roadmap | Family a 08/12/17 ROW b 08/14/17 MACRO c 08/15/17 CONN d 08/27/17 MACRO 来自多个电子表格的数据框(模型名称是电子表格名称,它们具有多个dataframe中的每个门的多个date),并具有以下格式: df1 (part1 – the dataframe derived from the spreadsheet with model a for gate 0 ): Model | Gate 0 a 02/01/18 df1 (Dataframe derived from the spreadsheet with model a for gate1): Model | Gate […]