Tag: pandas

从Excel文档导入数据头,使用pandassearch网页,然后在同一个Excel文档中导出到特定的行/列

我想弄清楚如何从一个特定的excel表导入数据,根据这些数据search雅虎财经的信息,然后打印通过雅虎收到的数据(通过pandas web.datareader)到同一个Excel中的特定行/列文件。 这是我迄今为止,但它不完成我要做的事情。 这将根据代码内的inputsearch信息,而不是从Excel工作表input,并将连接的数据框导出到新创build的电子表格,而不是预先存在的特定行和列。 import datetime as dt from datetime import datetime import pandas as pd import pandas_datareader.data as web start = dt.datetime.strptime("8/11/2017", "%m/%d/%Y") end = dt.datetime.today() headerlist = ('stock1 Open', 'stock1 Close', 'stock2 Open', 'stock2 Close', 'stock3 Open', 'stock3 Close', 'stock4 Open', 'stock4 Close') df1 = web.DataReader('stock1', 'yahoo', start, end)[['Open','Close']] df2 = web.DataReader('stock2', 'yahoo', […]

在全部3个dataframe的列A中查找A列

如何查看所有3个dataframeA列中的A列 我的数据看起来像从A,B开始 DFA a 1 dd 3 aa 4 DFB c 5 zz 6 dd 7 a 8 DFC a 33 c 44 dd 55 zz 66 欲望输出 a 1 a 8 a 33 dd 3 dd 7 dd 55 大pandas是否具有类似于Excel的多种查找方式? 我看到很多2列的例子,而不是查看所有数据框中的A列。

无法写入Excel中AttributeError:“工作表”对象没有属性“写”

我正在尝试写一个文本到一个excel我正在关注这个post 。 这是早些时候工作,但现在不是。 我得到: 错误: line 122, in <module> worksheet.write(0, 11, 'HI') AttributeError: 'Worksheet' object has no attribute 'write' DF1 AE cd c D 码: writer = pd.ExcelWriter("C:\\33.xlsx") df1.to_excel(writer, startrow=0, startcol=0, index = False) worksheet = writer.sheets['Sheet1'] worksheet.write(0, 11, 'YO') worksheet.write(1, 11, 'HI') 我也试过了: import xlrd import xlwt from xlutils.copy import copy import os.path rb […]

使用左alignment方式将数据框保存到xlsx

将pandas数据框保存为xlsx文件时,是否有任何方法可以保存它,以便保留string的列以左alignment方式保存,而不是默认的“中心”alignment方式? 我目前正在使用以下来保存我的DataFRame writer = pd.ExcelWriter(path_to_file) df.to_excel(writer, 'Sheet1') writer.save()

通过ID合并两个Excel文件并合并具有相同名称的列(python,pandas)

我是新来的python stackoverflow和pandas。 我在post中find了我的答案的一部分寻找合并两个Excel文件的ID到一个Excel文件使用Python 2.7 但是,我也想合并或组合来自两个excel文件同名的列。 我认为下面的post会有我的答案,但我想这不是正确的标题: 合并与相同的列名称的大pandas数据框 现在我有代码: import pandas as pd file1 = pd.read_excel("file1.xlsx") file2 = pd.read_excel("file2.xlsx") file3 = file1.merge(file2, on="ID", how="outer") file3.to_excel("merged.xlsx") file1.xlsx ID,JanSales,FebSales,testing 1100200,汽车 2200500, 3300400,船 file2.xlsx ID,CreditScore等,EMMAScore,testing 2,良好的,沃森,飞机 3,还好,汤普森, 4,不那么好,NA, 我得到的是merged.xlsx ID,JanSales,FebSales, test_x ,CreditScore,EMMAScore, test_y 1100200,汽车不同,NaN,NaN的, 2200500,好,沃森,飞机 3300400,船,还好,汤普森, 4,为NaN,NaN的,,不那么好,NaN的, 我想要的是merged.xlsx ID,JanSales,FebSales,CreditScore,EMMAScore, testing 1100200大,NaN,NaN的,汽车 2200500,好,沃森,飞机 3300400,还好,汤普森,船 4,为NaN,NaN的,不那么好,NaN的,萘乙酸 在我的实际数据中,有200多列对应于我的示例中的“testing”列。 我希望程序在file1.xlsx和file2.xlsx中find具有相同名称的这些列,并将它们合并到合并文件中。

如何在整个工作簿中使用Excel的格式化画笔

每个星期我都会用Python / Pandas生成一个大型的Excel表格。 但是,pandas的xls作者不允许用户使用专有格式来格式化excel表格。 目前,我必须在新生成的文件的工作表中去工作表,并在前一周复制表格中的格式有点讨厌。 有没有办法(按照优先顺序): 在Python中将所有格式从一个Excel表格复制到另一个表格 格式将工作簿中的所有工作簿绘制到第二个工作簿 这将是一个表格格式和链接,我可以更新和重新保存,但我希望像(1)或(2)的解决scheme。

pandas阅读csv取代#DIV / 0! 和#VALUE! 与NaN

我是Python的pandas新手,正忙于阅读一个csv文件。 不幸的是,Excel文件有一些单元格带有#VALUE! 和#DIV / 0! 在他们中。 我无法在Excel中修复此问题,因为数据是从其他工作表中提取的。 pandas把这些列变成objects而不是numpy64 ,所以我不能从他们的阴谋。 我想replace#VALUE! 和#DIV / 0! string与pandasNaN条目,但我找不到如何做到这一点。 我已经尝试了以下(我的代码运行,但它没有改变): import pandas as pd import numpy as np df = pd.read_csv('2013AllData.csv') df.replace('#DIV/0!', np.nan)

有没有办法写两个(或更多)数据框到一个Excel电子表格?

如果我可以使用pandas和xlsxwriter来将两个数据框(一个在另一个之上)堆叠在同一张Excel上,那么它将帮助我生成更加整洁,更加“人性化”的输出电子表格我输出。 请注意两个dataframe的数据是相关但不同的,一个是另一个的总结。 有没有一个简洁的方法,我可以把我的数据框和我的总结数据框,并将其堆叠在同一张表上?

读取/写入Excel文件中的特定位置

有一个真正的用例。 希望能够用pandas做一些数据聚合和操作,设想工作stream程如下: 在Excel文件中查找一个已命名的单元格 到达单元块的边界(由空列/行定义的边界) 将单元格块读入Pandas DataFrame 做pandas的东西 将生成的DataFrame写回到同一个Excel文件,到另一个命名的单元格定义的位置 保留Excel文件的图表和公式

大pandas将列(A)与其他列(B)进行比较,并返回列(A)中存在的唯一值

我正在面临一个问题,同时比较两列非常数据包含约5至6缺乏细胞。 我使用countif公式来检查A列中是否存在值B列。但是,这需要花费大量的时间来计算,我停止了使用Excel的任务。 而且我正在pandas中find另一种方法来做这件事。 是否可以通过比较列Bfind列A中唯一值的列表。请build议。 A栏:585256 B栏:556245