Tag: pandas

强迫pandas保持同名多列

我正在构build一个收集数据的程序,并将其每周添加到一个正在进行的Excel表(read_excel()和concat()中)。 我遇到的问题是我需要列的名称相同(用x.1,x.2,…看起来不太好)。 我只需要这个在最后的输出。 有什么办法可以做到这一点? 修改pandas是否太费时间了?

使用pandas将工作表添加到现有的Excel文件

# Set the working folder to the same folder as the script os.chdir(os.path.dirname(os.path.abspath(__file__))) test = send_request().content df = pd.read_csv(io.StringIO(test.decode('utf-8'))) writer = pd.ExcelWriter('NHL_STATS_JSB_final.xlsx', \ engine = 'xlsxwriter') df.to_excel(writer, 'Player statistics', index=False) writer.save() 我不明白为什么,但我试图将工作表Player statistics添加到我当前的NHL_STATS_JSB_final.xlsx文件,但它不工作。 我的代码不是将工作表添加到文件中,而是使用当前文件并删除以前的所有工作表来添加新的工作表。 我怎样才能删除所有其他的工作表添加Player statistics到我目前的Excel文件?

从colaboratory驱动中加载xlsx文件

如何从谷歌驱动器导入MS-excel(.xlsx)文件进入colaboratory? excel_file = drive.CreateFile({'id':'some id'}) 工作( drive是一个pydrive.drive.GoogleDrive对象)。 但, print excel_file.FetchContent() 返回None。 和 excel_file.content() 抛出: ()中的TypeErrorTraceback(最近调用最后一个)—-> 1 excel_file.content() TypeError:“_io.BytesIO”对象不可调用 我的意图是(给一些有效的文件'ID')作为一个io对象,它可以读取pandas read_excel() ,并最终得到一个pandas数据read_excel() 。

'latin-1'编解码器不能编码字符u'\ u2014'在位置23:序号不在范围内(256)

我正在从Excel工作簿加载数据到一个pandas数据框,并试图将它推到数据库,当我得到上述错误。 我首先想到了数据库的sorting问题,我改成了utf8_bin 接下来,我检查了我的数据库引擎创build语句,我也为编码添加了一个参数。 engine = create_engine('mysql+pymysql://root@localhost/test', encoding="utf-8") 但是这些东西都不起作用,我仍然从线上得到错误: df.to_sql("strand", engine, if_exists="append", index=False) 我检查是否有to_sql方法的编码参数,但似乎并不是这样。

版本0.15.2中的pandasto_excel不适用于date时间对象

将datetime对象写入Excel的一个简单示例不起作用,因为我将pandas版本更改为0.15.2。 我错过了什么吗? import pandas as pd import datetime df = pd.DataFrame([datetime.datetime.today()]) df.to_excel('test.xlsx') 年,月和日正确显示,小时等,我得到零。 如果我把它写入.csv,结果是OK。 可能是0.15.2中的一个错误?

用Python复制和重命名excel文件

我正在尝试复制一个Excel文件并重命名它。 例如我有一个文件HI.xlsx ,我想复制它,并将其重命名为BYE.xlsx 。 我的代码做到这一点在下面,当我运行它,文件BYE.xlsx创build,但它已损坏。 这是我正在使用的: fIn = open(r"HI.xlsx") fOut = open(r"BYE.xlsx", "w")

写入Excel时,“Unsparsify”pandas多指标

我有一个多索引的pandas数据框,默认情况下,当打印到屏幕上,将“稀疏”的输出,使索引的更高层次不重复。 例如: 疏: 我可以将其改为“unsparse”,如下所示: 但是,这个选项并没有被df.to_excel(writer)所尊敬,它总是将索引写成稀疏的,并且合并单元格。 有没有什么办法可以让这个写法在“无法parsing”的方式上出类拔萃? 或者我可以写一个csv并将其导入到excel中,因为csv总是“unsparse”,但这有点烦人。

Python df.to_excel()将数字作为文本存储在excel中。 如何存储为值?

我通过pd.read_html从谷歌财经刮表数据,然后通过df.to_excel()将该数据保存到Excel中,如下所示: dfs = pd.read_html('https://www.google.com/finance?q=NASDAQ%3AGOOGL&fstype=ii&ei=9YBMWIiaLo29e83Rr9AM', flavor='html5lib') xlWriter = pd.ExcelWriter(output.xlsx, engine='xlsxwriter') for i, df in enumerate(dfs): df.to_excel(xlWriter, sheet_name='Sheet{}'.format(i)) xlWriter.save() 但是,保存为excel的数字将作为文本存储在单元格angular落中的绿色小三angular形中。 在将这些数据移到excel中时,我如何将它们存储为实际值而不是文本? 任何帮助表示赞赏。 谢谢!!!

Pythonpandas操作DF,并创build样式和链接的Excel

问题1:组类似的行 我有一个数据框,看起来像这样: TTL1 TTL2 TTL3 0 val1 val2 val3 1 val1 val2 val3 2 val1 val2 val3 3 val1 val2 val3 134 val1 val2 val3 135 val1 val2 val3 136 val1 val2 val3 205 val1 val2 val3 我想检查索引号是否成功(例如,1,2,3或56,57,58等),如果是,则添加另一列以显示它们在同一组中,所以输出应该是: TTL1 TTL2 TTL3 GROUP_TTL 0 val1 val2 val3 0 1 val1 val2 val3 0 2 val1 val2 […]

使用pandas创build一个平均的数据框

From country Austria Belgium Denmark France Germany Italy Luxembourg Switzerland The Netherlands United Kingdom Austria 0 0 0 0 0 0 3 0 6 1 Belgium 0 0 0 2 1 1 0 0 5 1 Denmark 0 2 0 2 0 1 0 2 3 0 France 0 0 0 0 6 0 0 […]