Tag: python

使用Pandas DataFrame比较两个Excel文件与不同的标题，但相同的行数据: 这里我试图比较两个excel文件。 Server_report有42列，Email_report有19列（其中5列与server_report完全不匹配）。每个报告中有14个列匹配，但具有不同的标题。当我打开这两个文件时，我会对三列进行sorting，以便将数据按照“交货”，“select数量”，“批量”（按server_report）和“交货”，“采购数量”，“批量select”根据email_reportsorting）。我需要的是将sorting后的email_report与server_report进行比较（每个文件具有相同数量的行，并且可以在“Delivery”列进行索引）。如果server_report上存在“缺失”信息，则需要使用从email_report中获取的信息填写。之后，需要生成两个新文件。包含所有原始42列的新server_report，其中包含来自email_report的更改。包含比较过程中所做更改的新文件。我的问题在这里是这篇文章的标题。如何能比较两个文件不同的列/标题（不是所有可以映射到另一个）

使用Python的Excel数据: 我有一个旧的excel电子表格，有关系数据库types格式的大量数据，有一个主要的主键，我需要通过。我想比较一些行，但是有很多条目（成千上万行，几十列），Excel并没有真正的内置function来做到这一点。环顾四周后，我发现提取数据的最佳方式是使用Python脚本，但是在Python或任何语言中我都没有编程技巧。我需要在键列中查找重复项，然后检查在同一列中是否有重复的行，如果是这样，则将它们合并到一个新行中，然后将新的excel文件/工作表从合并的行中分离出来。我不知道这听起来是不是太复杂了，我在这里是新来的，所以我做了一些search互联网的研究，看看我是否能find任何脚本来做，但没有真正的运气…这里是最接近的post我发现可能与我想要的有关，但我通常发现的是想要将两个不同的excel文件合并在一起： http://pbpython.com/excel-file-combine.html 试图用Python 2.7将两个Excel文件合并成一个Excel文件（我有更多的链接，但只能张贴两个。）基本上我正在寻找重复的行，并希望将它们合并成一个新的文件或电子表格在Excel中，将它们从非愚蠢的东西中分离出来，并把它们全部放回到一起。

如何导入一个Excel工作表作为一个整体，并保存在Mysql数据库使用Python: 我有一个Excel文件（.xlsx）与45列1000多行。我想采取所有的数据，并使用Python 3.5将其存储在MySQL数据库中。我做了什么：- 我已经使用openpyxl将这些值存储在Python列表中，然后将其存储在数据库中。 import pymysql import openpyxl source_excel=input('Enter the source excel file name-> ') wb=openpyxl.load_workbook(source_excel) sheet=wb.active strt=int(input('Enter starting range-> ')) end=int(input('Enter ending range-> ')) name=[] for q in range(strt,end): a=q,sheet.cell(row=q,column=1).value name.append(a) 因此，与最后3行代码相同的方式，我使用它45次，然后通过更改列编号进入数据库。有什么办法可以将Excel文件的所有数据作为批量获取并存储在Mysql中？另外，如果可能的话，请帮助我如何导出一个MySQL表作为一个Excel文件。谢谢！

如何同时写入不同的excel使用Python: 我尝试写入所有文件，我有同时。我有一些文件 izzymonroe@mail.ru.xlsx, lucky-frog@mail.ru.xlsx, lucky-frog@mail.ru.xlsx, izzymonroe@mail.ru.xlsx, Yubodrova@ya.ru.xlsx, lucky-frog@mail.ru.xlsx, Ant.karpoff2011@yandex.ru.xlsx 9rooney9@list.ru.xlsx 我想写数据到这个。但我怎么能发送它的function（我需要写入文件的值groupby ） df = pd.read_excel('group.xlsx') def add_xlsx_sheet(df, sheet_name=u'Смартфоны полно', index=True, digits=1, path='9rooney9@list.ru.xlsx'): book = load_workbook(path) writer = ExcelWriter('9rooney9@list.ru.xlsx', engine='openpyxl') writer.book = book writer.sheets = dict((ws.title, ws) for ws in book.worksheets) if sheet_name in list(writer.sheets.keys()): sh = book.get_sheet_by_name(sheet_name) book.remove_sheet(sh) df.to_excel(writer, sheet_name=u'Смартфоны полно', startrow=0, startcol=0, float_format='%.{}f'.format(digits), […]

django-import-export ForeignKeyWidget不会查找: 我试图用django-import-export导入一个xls文件。这是我的： class CourseResource(resources.ModelResource): course_number = fields.Field(column_name='Kursnummer', attribute='course_number', widget=CharWidget()) school_year = fields.Field(column_name='Schuljahr', attribute='school_year', widget=ForeignKeyWidget(model=SchoolYear, field='name')) #other fields…. class Meta: model = Course exclude = ('students') export_order = ('id', 'course_number', 'school_year') SchoolYear模型： class SchoolYear(models.Model): name = models.CharField(max_length=25, unique=True) start_date = models.DateField(verbose_name="Beginn") end_date = models.DateField(verbose_name="Ende") def __str__(self): return self.name def __unicode__(self): return self.name 课程模式： class Course(models.Model): course_number […]

Python：用OpenPyXL模拟CSV.DictReader: 我有一个Excel（.xlsx）文件，我试图parsing，逐行。我有一个标题（第一行），有一堆列标题，如学校，名字，姓氏，电子邮件等当我循环遍历每一行时，我想能够像这样说： row['School'] 并取回当前行和“School”作为标题的列的单元格的值。我已经浏览了OpenPyXL文档，但似乎找不到任何有用的东西。有什么build议么？

使用openpyxl查找单元时遇到问题: 我试图find一个单元格在Excel中的值，首先find它所在的行，然后通过单元格的坐标（列将每次相同）。我尝试使用下面的代码，与它的问题是，它rownum不是行数（正如我所期待的）。请有人可以帮我find包含我正在寻找的值的行号： wb = openpyxl.load_workbook('C:\\rtemp\\Names.xlsx') ws = wb['Sheet5'] rownum = 0 for row in ws: for cell in row: if cell.value == 'ResellBalance': rownum = row break ExcelValue = ws.cell(row=rownum, column=2).value print(ExcelValue)

整合多个pandas数据框与不可预知的列标题/订单到单个框架或列表: 我已经在这个话题上search了很多，并且找不到解决这个特定问题的任何问题。铌我对编码和python很新。我正在阅读多个结构相似的excel源数据文件，但列标题是不可预知的，因为顺序可能会更改，某些文件列中的某些列标题会丢失，而其他文件则不会。 import pandas as pd import glob import csv import os outfile = open('./output/output.csv','w') big_df = pd.DataFrame() dataList = [] path = "./files/" #load xlsx files from directory allFiles = glob.glob(os.path.join(path, "*.xlsx")) # loop through each file, finding the right sheet for f in allFiles: try: #read sheet as dataframe and append to […]

如何绘制一个事件相对于其他事件的频率？: 我想用python / matplotlib / pandas来达到我的目的。问题描述：我有一个Excel表格（我可以读作pandas数据框）包含一个真实和估计值的表格。我想以某种方式捕捉这个信息的实际（横轴）与估计值（垂直轴）的情节。 Excel表格看起来有点如下：我在想散点图。但我不知道如何获得这样的情节。在这种情况下，这不是一个简单的散点图。另外，轴需要不同的处理。如果有其他适当的方法，请随时提出build议。编辑1：正如@BrenBarn所build议的那样，我在“ 交叉validation”中发布了我的查询。我特别喜欢的一个答案显示了下面的可视化：（见链接）我想用python生成一个类似的散点图。谁能帮我吗？

在VBA中传递数组作为RunPython脚本的参数（xlwings）: 在我的VBA sub中，我使用xlwings中的RunPython命令调用python脚本。我想调用一个数组作为参数的函数。如何将VBA数据types转换为Python可读的列表？码： RunPython("import script; script.query(dates=argsArray, queryString='"& myString &"') 我可以成功地传递一个string，虽然我不知道如何传递数组argsArray作为参数。