Tag: python

使用Pandas DataFrame比较两个Excel文件与不同的标题,但相同的行数据

这里我试图比较两个excel文件。 Server_report有42列,Email_report有19列(其中5列与server_report完全不匹配)。 每个报告中有14个列匹配,但具有不同的标题。 当我打开这两个文件时,我会对三列进行sorting,以便将数据按照“交货”,“select数量”,“批量”(按server_report)和“交货”,“采购数量”,“批量select”根据email_reportsorting)。 我需要的是将sorting后的email_report与server_report进行比较(每个文件具有相同数量的行,并且可以在“Delivery”列进行索引)。 如果server_report上存在“缺失”信息,则需要使用从email_report中获取的信息填写。 之后,需要生成两个新文件。 包含所有原始42列的新server_report,其中包含来自email_report的更改。 包含比较过程中所做更改的新文件。 我的问题在这里是这篇文章的标题。 如何能比较两个文件不同的列/标题(不是所有可以映射到另一个)

使用Python的Excel数据

我有一个旧的excel电子表格,有关系数据库types格式的大量数据,有一个主要的主键,我需要通过。 我想比较一些行,但是有很多条目(成千上万行,几十列),Excel并没有真正的内置function来做到这一点。 环顾四周后,我发现提取数据的最佳方式是使用Python脚本,但是在Python或任何语言中我都没有编程技巧。 我需要在键列中查找重复项,然后检查在同一列中是否有重复的行,如果是这样,则将它们合并到一个新行中,然后将新的excel文件/工作表从合并的行中分离出来。 我不知道这听起来是不是太复杂了,我在这里是新来的,所以我做了一些search互联网的研究,看看我是否能find任何脚本来做,但没有真正的运气…这里是最接近的post我发现可能与我想要的有关,但我通常发现的是想要将两个不同的excel文件合并在一起: http://pbpython.com/excel-file-combine.html 试图用Python 2.7将两个Excel文件合并成一个Excel文件 (我有更多的链接,但只能张贴两个。) 基本上我正在寻找重复的行,并希望将它们合并成一个新的文件或电子表格在Excel中,将它们从非愚蠢的东西中分离出来,并把它们全部放回到一起。

如何导入一个Excel工作表作为一个整体,并保存在Mysql数据库使用Python

我有一个Excel文件(.xlsx)与45列1000多行。 我想采取所有的数据,并使用Python 3.5将其存储在MySQL数据库中。 我做了什么:- 我已经使用openpyxl将这些值存储在Python列表中,然后将其存储在数据库中。 import pymysql import openpyxl source_excel=input('Enter the source excel file name-> ') wb=openpyxl.load_workbook(source_excel) sheet=wb.active strt=int(input('Enter starting range-> ')) end=int(input('Enter ending range-> ')) name=[] for q in range(strt,end): a=q,sheet.cell(row=q,column=1).value name.append(a) 因此,与最后3行代码相同的方式,我使用它45次,然后通过更改列编号进入数据库。 有什么办法可以将Excel文件的所有数据作为批量获取并存储在Mysql中? 另外,如果可能的话,请帮助我如何导出一个MySQL表作为一个Excel文件。 谢谢!

如何同时写入不同的excel使用Python

我尝试写入所有文件,我有同时。 我有一些文件 izzymonroe@mail.ru.xlsx, lucky-frog@mail.ru.xlsx, lucky-frog@mail.ru.xlsx, izzymonroe@mail.ru.xlsx, Yubodrova@ya.ru.xlsx, lucky-frog@mail.ru.xlsx, Ant.karpoff2011@yandex.ru.xlsx 9rooney9@list.ru.xlsx 我想写数据到这个。 但我怎么能发送它的function(我需要写入文件的值groupby ) df = pd.read_excel('group.xlsx') def add_xlsx_sheet(df, sheet_name=u'Смартфоны полно', index=True, digits=1, path='9rooney9@list.ru.xlsx'): book = load_workbook(path) writer = ExcelWriter('9rooney9@list.ru.xlsx', engine='openpyxl') writer.book = book writer.sheets = dict((ws.title, ws) for ws in book.worksheets) if sheet_name in list(writer.sheets.keys()): sh = book.get_sheet_by_name(sheet_name) book.remove_sheet(sh) df.to_excel(writer, sheet_name=u'Смартфоны полно', startrow=0, startcol=0, float_format='%.{}f'.format(digits), […]

django-import-export ForeignKeyWidget不会查找

我试图用django-import-export导入一个xls文件。 这是我的: class CourseResource(resources.ModelResource): course_number = fields.Field(column_name='Kursnummer', attribute='course_number', widget=CharWidget()) school_year = fields.Field(column_name='Schuljahr', attribute='school_year', widget=ForeignKeyWidget(model=SchoolYear, field='name')) #other fields…. class Meta: model = Course exclude = ('students') export_order = ('id', 'course_number', 'school_year') SchoolYear模型: class SchoolYear(models.Model): name = models.CharField(max_length=25, unique=True) start_date = models.DateField(verbose_name="Beginn") end_date = models.DateField(verbose_name="Ende") def __str__(self): return self.name def __unicode__(self): return self.name 课程模式: class Course(models.Model): course_number […]

Python:用OpenPyXL模拟CSV.DictReader

我有一个Excel(.xlsx)文件,我试图parsing,逐行。 我有一个标题(第一行),有一堆列标题,如学校,名字,姓氏,电子邮件等 当我循环遍历每一行时,我想能够像这样说: row['School'] 并取回当前行和“School”作为标题的列的单元格的值。 我已经浏览了OpenPyXL文档,但似乎找不到任何有用的东西。 有什么build议么?

使用openpyxl查找单元时遇到问题

我试图find一个单元格在Excel中的值,首先find它所在的行,然后通过单元格的坐标(列将每次相同)。 我尝试使用下面的代码,与它的问题是,它rownum不是行数(正如我所期待的)。 请有人可以帮我find包含我正在寻找的值的行号: wb = openpyxl.load_workbook('C:\\rtemp\\Names.xlsx') ws = wb['Sheet5'] rownum = 0 for row in ws: for cell in row: if cell.value == 'ResellBalance': rownum = row break ExcelValue = ws.cell(row=rownum, column=2).value print(ExcelValue)

整合多个pandas数据框与不可预知的列标题/订单到单个框架或列表

我已经在这个话题上search了很多,并且找不到解决这个特定问题的任何问题。 铌我对编码和python很新。 我正在阅读多个结构相似的excel源数据文件,但列标题是不可预知的,因为顺序可能会更改,某些文件列中的某些列标题会丢失,而其他文件则不会。 import pandas as pd import glob import csv import os outfile = open('./output/output.csv','w') big_df = pd.DataFrame() dataList = [] path = "./files/" #load xlsx files from directory allFiles = glob.glob(os.path.join(path, "*.xlsx")) # loop through each file, finding the right sheet for f in allFiles: try: #read sheet as dataframe and append to […]

如何绘制一个事件相对于其他事件的频率?

我想用python / matplotlib / pandas来达到我的目的。 问题描述:我有一个Excel表格(我可以读作pandas数据框)包含一个真实和估计值的表格。 我想以某种方式捕捉这个信息的实际(横轴)与估计值(垂直轴)的情节。 Excel表格看起来有点如下: 我在想散点图。 但我不知道如何获得这样的情节。 在这种情况下,这不是一个简单的散点图。 另外,轴需要不同的处理。 如果有其他适当的方法,请随时提出build议。 编辑1: 正如@BrenBarn所build议的那样,我在“ 交叉validation”中发布了我的查询。 我特别喜欢的一个答案显示了下面的可视化:( 见链接) 我想用python生成一个类似的散点图。 谁能帮我吗?

在VBA中传递数组作为RunPython脚本的参数(xlwings)

在我的VBA sub中,我使用xlwings中的RunPython命令调用python脚本。 我想调用一个数组作为参数的函数。 如何将VBA数据types转换为Python可读的列表? 码: RunPython("import script; script.query(dates=argsArray, queryString='"& myString &"') 我可以成功地传递一个string,虽然我不知道如何传递数组argsArray作为参数。