Tag: pandas

在现有的excel表格中填写pd数据框(使用openpyxl v2.3.2)

我想把一些pandas数据框填入现有的 excel文件中。 我遵循的指示: 如何写入现有的Excel文件,而不覆盖数据(使用pandas)? 使用: from openpyxl import load_workbook import pandas as pd import numpy as np book=load_workbook("excel_proc.xlsx") writer=pd.ExcelWriter("excel_proc.xlsx", engine="openpyxl") writer.book = book writer.sheets = dict((ws.title, ws) for ws in book.worksheets) data_df.to_excel(writer, sheet_name="example", startrow=100, startcol=5, index=False) writer.save() 但是,现有的工作表将被删除,“示例”工作表被生成,只有df被集成在定义的位置。 我做错了什么? 我想把“data_df”写入现有的“示例”表格中现有的excel文件中,保留其他表单和数据。 谢谢 示例df: data_df=pd.DataFrame(np.arange(12).reshape((2, 6)), index=["Time","Value"])

NaN在pandas.DataFrame中不打印到Excel

我有一个包含numpy.nan浮动numpy.nan 。 但是,使用Excel numpy.nan ,应该有numpy.nan浮动的字段为空。 我会期望至less一个string表示,而不是什么。 任何想法,为什么这可能是? 作家代码如下: writer=pandas.ExcelWriter('output.xls') frame.to_excel(writer,'tab name') writer.save() 凡frame看起来像这样(注意在2013年1月1日NaN): Series ID Risk Bucket Contract PX Last Contract Value (Local) Currency X Contract Value (USD) Currency 2013-01-01 Future_ES EQ ES1 Index NaN NaN 1 NaN USD Curncy 2013-01-02 Future_ES EQ ES1 Index 1447.16 72362.5 1 72362.5 USD Curncy 2013-01-03 Future_ES EQ ES1 […]

Python并从Excel文件导入浮点数字

所以我有一个像这样的excel文件 Name R s l2 max_amplitude ref_amplitude R_0.3_s_0.5_l2_0.1 0.3 0.5 0.1 1.45131445 1.45131445 R_0.3_s_0.5_l2_0.6 0.3 0.5 0.6 3.52145743 3.52145743 … R_1.1_s_2.0_l2_1.6 1.1 2.0 1.6 5.07415199 5.07415199 R_1.1_s_2.0_l2_2.1 1.1 2.0 2.1 5.78820419 5.78820419 R_1.1_s_2.0_l2_2.6 1.1 2.0 2.6 5.84488964 5.84488964 R_1.1_s_2.0_l2_3.1 1.1 2.0 3.1 6.35387516 6.35387516 使用pandas模块将数据导入到数据框中 import pandas as pd df = pd.read_excel("output_var.xlsx", header=0) 一切似乎都可以: df […]

怎样才能有效地做到PANDAS中Excel的MATCH函数(小于)?

excel中的MATCH函数允许一个可选参数集,它将返回小于给定值的最大值,或大于给定值的最小值。 假设我有一个DataFrame, x 。 In [1]: x = pd.DataFrame(data=list(range(0, 11)), columns=["Obs"]) In [2]: x Out[2]: Obs 0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 还有一个数据框y 。 In [3]: y = pd.DataFrame(data=[(-1, "Small"), (4, "Medium"), (7, "Large")], columns=["Obs", "Cat"]) In [4]: y […]

通过pd.read_excel()读取excel表格作为多索引dataframe

我很难用pd.read_excel()来读取excel表格。 我的Excel表格看起来像这样的原始forms: 我期望数据框看起来像这样: bar baz foo one two one two one two ABCDEF baz one 0.085930 -0.848468 0.911572 -0.705026 -1.284458 -0.602760 two 0.385054 2.539314 0.589164 0.765126 0.210199 -0.481789 three -0.352475 -0.975200 -0.403591 0.975707 0.533924 -0.195430 这甚至有可能吗? 我失败的尝试: xls_file = pd.read_excel(data_file, header=[0,1,2], index_col=None) 链接到原始Excel文件: https://www.dropbox.com/s/ek646ab4yb1fvdq/ipsos_excel_tables_type_2_trimed_nosig.xlsx?dl=0

拼合双嵌套的JSON

我想展平一个如下所示的JSON文件: { "teams": [ { "teamname": "1", "members": [ { "firstname": "John", "lastname": "Doe", "orgname": "Anon", "phone": "916-555-1234", "mobile": "", "email": "john.doe@wildlife.net" }, { "firstname": "Jane", "lastname": "Doe", "orgname": "Anon", "phone": "916-555-4321", "mobile": "916-555-7890", "email": "jane.doe@wildlife.net" } ] }, { "teamname": "2", "members": [ { "firstname": "Mickey", "lastname": "Moose", "orgname": "Moosers", "phone": "916-555-0000", "mobile": "916-555-1111", […]

问:Python(pandas或其他) – 我需要“扁平化”来自多行的数据文件,less数列为1行多列

我需要“扁平”一个数据文件从多行,几列到1行多列。 我目前在pandas中有一个数据框(从Excel加载),最终需要改变数据的显示方式,这样我才能以逻辑方式积累大量的数据。 下表是试图说明我的要求。 从: 1 2 Ryan 0.706 0.071 Chad 0.151 0.831 Stephen 0.750 0.653 至: 1_Ryan 1_Chad 1_Stephen 2_Ryan 2_Chad 2_Stephen 0.706 0.151 0.75 0.071 0.831 0.653 谢谢你的帮助!

阅读MS Excel的XML文件pandas数据框?

我有一个MS Excel XML(2003)文件与以下元数据: <?xml version="1.0" encoding="UTF-8"?> <?mso-application progid="Excel.Sheet"?><Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet" xmlns:c="urn:schemas-microsoft-com:office:component:spreadsheet" xmlns:html="http://www.w3.org/TR/REC-html40" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet" xmlns:x2="http://schemas.microsoft.com/office/excel/2003/xml" xmlns:x="urn:schemas-microsoft-com:office:excel" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"><OfficeDocumentSettings xmlns="urn:schemas-microsoft-com:office:office"> 我想把它读入一个pandas数据框。 什么是这样做的好方法? 谢谢。

pandas数据框从excel命名的范围

有没有一种简单的方法来从一个命名的范围在Excel中的pandas数据框。 read_excel被devise为读取工作簿中的整个工作表。

Excel像pandas公式一样

我有一个这种格式的pandas数据DataFrame User_id|2014-01|2014-02|2014-03|2014-04|2014-05|…|2014-12 1 | 7 | NaN | NaN | NaN | NaN |…| NaN 2 | NaN | 5 | NaN | NaN | 9 |…| NaN 3 | 2 | 4 | NaN | NaN | NaN |…| NaN 换句话说,列是几个月,索引是user_id ,每个单元格包含一个整数,或NaN 这些数字代表已采取的行动,如果在3个月之后,则认为行动是成功的,不需要采取其他行动。 我的目标是find成功的行动清单 在Excel中,我会写一个像这样的公式: Sheet2!E5=AND(Sheet1!E5<>"NaN",Sheet1!D5="NaN",Sheet1!C5="NaN",Sheet1!B5="NaN") 然后将它拖到其余的列,然后我会有一个指标,行动是否成功。 怎样才能有效地完成大pandas? 示例输出: 对于上面给出的例子,期望的输出应该是: User_id|2014-01|2014-02|2014-03|2014-04|2014-05| 1 | T […]