Tag: python

pandas:根据公共列名称将多个数据框中的列提取到新的数据框中

我从Excel导入4个数据集,包含2013学年,2014,2015和2016学年的total_budget。所有数据集都有一个共同的列,每个学校的ID代码(列LAESTAB)。 我想要一个新的数据集,左边是共同列LAESTAB(4个数据集中的值相同),然后是总共2013,总计2014,总计2015和总数2016(来自不同数据集)。 我也想摆脱其余的数据,包括所有数据集中不存在的学校ID。 我将尝试在一个例子中进一步阐述它: 下面是一个Excel数据集的例子: >>> print cuts2016.head() LA_codelocal_authority_name UPIN URN LAESTAB \ 0 201 City of London 500000 0.0 2013614 1 202 Camden 500005 0.0 2022095 2 202 Camden 500007 0.0 2022219 3 202 Camden 500012 0.0 2022502 4 202 Camden 500014 0.0 2022603 School Name Academy? Phase Provider Type \ 0 Sir John […]

切片机列表中的Excel和Python

有没有人知道如何处理Excel中的切片器列表从Python。 我正在用一些excel文件,其中一个有一些切片机列表。 当我运行下一个代码 from openpyxl import load_workbook wP =load_workbook(r'C:\Users\Arrontec\Desktop\Automatizacion\Request1.xlsx') wB =load_workbook(r'C:\Users\Arrontec\Desktop\Automatizacion\CR_Accounts_Dashboard_V4_20170127_1.xlsx') wPs = wP.get_sheet_by_name('Sheet1') wBs = wB.get_sheet_by_name('Request_Raw_Data') for rrow in wPs.iter_rows(): for cell in rrow: wBs[cell.coordinate] = cell.value wB.save('CR_Accounts_Dashboard_V4_20170127_1.xlsx') 我收到这个消息 UserWarning:切片机列表扩展名不支持,将被删除警告(味精) 经过一番研究,我发现openpyxl不支持切片器列表,有人知道任何库与切片器一起工作。 对不起,英文不好,谢谢你的帮助。

如何使用win32com模块在excel中填充列表

我正在尝试将列表写入excel,列表包含几列。 我在下面列出了我的代码。 它似乎只提取第一个值。 我是相当新的python,我错过了什么? 码: import win32com.client as win32 # Z = [3,4,6,8,9,11,40] Q = ['x','y','z','e','g','AA','BB'] excel = win32.gencache.EnsureDispatch('Excel.Application') wb = excel.Workbooks.Add() ws = wb.Worksheets.Add() ws.Name = "MyNewSheet" ws.Range(ws.Cells(1,1),ws.Cells(1,2)).Value = ['Z','Q'] for i,e in enumerate (Z): ws.Range("A2:A8").Value = [ i for i in (Z)] for i,e in enumerate (Z): ws.Range("B2:B8").Value = [ i for i […]

excel和scipy累积二项式分布p值的区别?

我有这张表(NumSucc =成功次数,NumberTrials =试验次数,Prob是成功概率): Gene NumSucc NumTrials Prob Gene1 16 26 0.9548 Gene2 16 26 0.9548 Gene3 12 21 0.9548 Gene4 17 27 0.9548 Gene5 17 27 0.9548 Gene6 17 27 0.9548 Gene7 8 15 0.9548 Gene8 10 17 0.9548 我想要一个累积二项分布P值为每一行。 当我把这个精确的表格放入excel列AD中,然后在E列中input函数(例如,对于第2行): =BINOMDIST(B2,C2,D2,1) 输出表如下所示: Gene NumSucc NumTrials Prob Binomial Gene1 16 26 0.9548 9.68009E-08 Gene2 16 […]

xlsxwriter在workbook.close()之前捕获一个错误

我有一个使用xlsxwriter将10个工作表保存到.xlsx的脚本。 当我尝试closures工作表时,出现错误: "UnicodeDecodeError: 'ascii' codec can't decode byte 0xea in position 28: ordinal not in range(128)". 当我将表格写入工作表时,我尝试去捕捉错误,但没有成功。 因此,我的工作表根本没有得到保存,我无法处理该行的exception情况。 这是我的代码 – def xlsx_writer(name, data): worksheet1 = workbook.add_worksheet(name) line_number = 0 for line in data: try: worksheet1.write_row(line_number, 0, line) except UnicodeDecodeError: line = [x.decode('utf-8') for x in line] worksheet1.write_row(line_number, 0, line) 如何在写入每行时捕获错误,而不是在closures工作簿时?

使用pythonparsingExcel中的数据

在Excel中,我必须将下面的值从一个单元格分成两个: 2016-12-12 (r=0.1) 2016-12-13* (r=0.7) 如何在Python中这样做,以便在Excel文件中,date和“r =#”将在不同的单元格中? 还有,有办法自动删除“*”的标志?

使用行和列编号而不是单元格地址Python编写Excel公式

我目前有以下代码: revenue_stats_feb = pd.DataFrame({'February' :['=D7/D40','=D7/D39','=D7/D37','=D7/D11','=D8/D7', '=D10/D8'], 'merge': [1,2,3,4,5,6]}) revenue_stats_feb = revenue_stats_feb[['February', 'merge']] 我想知道是否可以使用行和列编号而不是单元格地址来编写公式,即'= D7 / D40'将是'=(3,6)/(3,39)',但是当它得到出口到Excel仍然计算为D7 / D40会。 我在这里先向您的帮助表示感谢。

Excel-Levenshteinalgorithm应用于列

我正在尝试使用Levenshteinalgorithm来查找logging之间的相似性。 我有什么是项目#的列,说明,查找,相似性(%),ReturnSimilarItem。 在列描述我有几个不同的描述,在lookUp项目中,我将具有类似的值,以描述列中的值。 使用Levenshtein函数我想要识别相似性,如果超过90%,我想返回附加到类似项目的Item#列的值。请参阅图片以获得更好的描述。 这里是我使用的Levenshtein的代码: Function Levenshtein3(ByVal string1 As String, ByVal string2 As String) As Long Dim i As Long, j As Long, string1_length As Long, string2_length As Long Dim distance(0 To 60, 0 To 50) As Long, smStr1(1 To 60) As Long, smStr2(1 To 50) As Long Dim min1 As Long, min2 As Long, […]

在Python中select正确的值

总体概述: 我正在创build一个大型数据集的graphics,但是我已经创build了一个示例文本文档,以便更容易地克服这些问题。 数据来自Excel文档,将被保存为CSV。 问题: 我能够编译数据,它将图表(见下文)然而,我怎么拉数据将不适用于所有不同的Excel表格,我将要脱离。 更详细的问题: 正在从数字26和31(参见图片和代码)的Excel表中拉出Y值(标记的“值”和“值1”)。 这是一个问题,因为值26和31对于每个图都不相同。 让我们看看这个更有意义。 这是我的代码 import pandas as pd import matplotlib.pyplot as plt pd.read_csv('CSV_GM_NB_Test.csv').T.to_csv('GM_NB_Transpose_Test.csv,header=False) df = pd.read_csv('GM_NB_Transpose_Test.csv', skiprows = 2) DID = df['SN'] Value = df['26'] Value1 = df['31'] x= (DID[16:25]) y= (Value[16:25]) y1= (Value1[16:25]) """ print(x,y) print(x,y1) """ plt.plot(x.astype(int), y.astype(int)) plt.plot(x.astype(int), y1.astype(int)) plt.show() 输出: 数据集: 在下面的评论中,你会发现0bin到我的数据集这是因为我没有足够的声望发布两个链接。 正如你可以从数据集看到的 X- DID […]

如何将Excel文件的内容复制到使用python的电子邮件正文中

我正在写一个Python脚本来发送电子邮件。 现在它发送一个excel文件作为附件,而是我想发送电子邮件的正文与Excel文件的内容。 就像用颜色复制excel文件的内容,格式化等,并粘贴到电子邮件正文中。 我怎么做? 我的python脚本如下: #!/usr/local/bin/python2.7 import smtplib,email,email.encoders,email.mime.text,email.mime.base from email.mime.multipart import MIMEMultipart from email.mime.text import MIMEText from email import encoders from email.message import Message from email.mime.audio import MIMEAudio from email.mime.base import MIMEBase from email.mime.image import MIMEImage from email.mime.multipart import MIMEMultipart from email.mime.text import MIMEText import schedule import time msg = MIMEMultipart() # me == my […]