Tag: pandas

在现有的excel表格中填写pd数据框（使用openpyxl v2.3.2）: 我想把一些pandas数据框填入现有的 excel文件中。我遵循的指示：如何写入现有的Excel文件，而不覆盖数据（使用pandas）？使用： from openpyxl import load_workbook import pandas as pd import numpy as np book=load_workbook("excel_proc.xlsx") writer=pd.ExcelWriter("excel_proc.xlsx", engine="openpyxl") writer.book = book writer.sheets = dict((ws.title, ws) for ws in book.worksheets) data_df.to_excel(writer, sheet_name="example", startrow=100, startcol=5, index=False) writer.save() 但是，现有的工作表将被删除，“示例”工作表被生成，只有df被集成在定义的位置。我做错了什么？我想把“data_df”写入现有的“示例”表格中现有的excel文件中，保留其他表单和数据。谢谢示例df： data_df=pd.DataFrame(np.arange(12).reshape((2, 6)), index=["Time","Value"])

NaN在pandas.DataFrame中不打印到Excel: 我有一个包含numpy.nan浮动numpy.nan 。但是，使用Excel numpy.nan ，应该有numpy.nan浮动的字段为空。我会期望至less一个string表示，而不是什么。任何想法，为什么这可能是？作家代码如下： writer=pandas.ExcelWriter('output.xls') frame.to_excel(writer,'tab name') writer.save() 凡frame看起来像这样（注意在2013年1月1日NaN）： Series ID Risk Bucket Contract PX Last Contract Value (Local) Currency X Contract Value (USD) Currency 2013-01-01 Future_ES EQ ES1 Index NaN NaN 1 NaN USD Curncy 2013-01-02 Future_ES EQ ES1 Index 1447.16 72362.5 1 72362.5 USD Curncy 2013-01-03 Future_ES EQ ES1 […]

Python并从Excel文件导入浮点数字: 所以我有一个像这样的excel文件 Name R s l2 max_amplitude ref_amplitude R_0.3_s_0.5_l2_0.1 0.3 0.5 0.1 1.45131445 1.45131445 R_0.3_s_0.5_l2_0.6 0.3 0.5 0.6 3.52145743 3.52145743 … R_1.1_s_2.0_l2_1.6 1.1 2.0 1.6 5.07415199 5.07415199 R_1.1_s_2.0_l2_2.1 1.1 2.0 2.1 5.78820419 5.78820419 R_1.1_s_2.0_l2_2.6 1.1 2.0 2.6 5.84488964 5.84488964 R_1.1_s_2.0_l2_3.1 1.1 2.0 3.1 6.35387516 6.35387516 使用pandas模块将数据导入到数据框中 import pandas as pd df = pd.read_excel("output_var.xlsx", header=0) 一切似乎都可以： df […]

怎样才能有效地做到PANDAS中Excel的MATCH函数（小于）？: excel中的MATCH函数允许一个可选参数集，它将返回小于给定值的最大值，或大于给定值的最小值。假设我有一个DataFrame， x 。 In [1]: x = pd.DataFrame(data=list(range(0, 11)), columns=["Obs"]) In [2]: x Out[2]: Obs 0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 还有一个数据框y 。 In [3]: y = pd.DataFrame(data=[(-1, "Small"), (4, "Medium"), (7, "Large")], columns=["Obs", "Cat"]) In [4]: y […]

通过pd.read_excel（）读取excel表格作为多索引dataframe: 我很难用pd.read_excel()来读取excel表格。我的Excel表格看起来像这样的原始forms：我期望数据框看起来像这样： bar baz foo one two one two one two ABCDEF baz one 0.085930 -0.848468 0.911572 -0.705026 -1.284458 -0.602760 two 0.385054 2.539314 0.589164 0.765126 0.210199 -0.481789 three -0.352475 -0.975200 -0.403591 0.975707 0.533924 -0.195430 这甚至有可能吗？我失败的尝试： xls_file = pd.read_excel(data_file, header=[0,1,2], index_col=None) 链接到原始Excel文件： https://www.dropbox.com/s/ek646ab4yb1fvdq/ipsos_excel_tables_type_2_trimed_nosig.xlsx?dl=0

拼合双嵌套的JSON: 我想展平一个如下所示的JSON文件： { "teams": [ { "teamname": "1", "members": [ { "firstname": "John", "lastname": "Doe", "orgname": "Anon", "phone": "916-555-1234", "mobile": "", "email": "john.doe@wildlife.net" }, { "firstname": "Jane", "lastname": "Doe", "orgname": "Anon", "phone": "916-555-4321", "mobile": "916-555-7890", "email": "jane.doe@wildlife.net" } ] }, { "teamname": "2", "members": [ { "firstname": "Mickey", "lastname": "Moose", "orgname": "Moosers", "phone": "916-555-0000", "mobile": "916-555-1111", […]

问：Python（pandas或其他） – 我需要“扁平化”来自多行的数据文件，less数列为1行多列: 我需要“扁平”一个数据文件从多行，几列到1行多列。我目前在pandas中有一个数据框（从Excel加载），最终需要改变数据的显示方式，这样我才能以逻辑方式积累大量的数据。下表是试图说明我的要求。从： 1 2 Ryan 0.706 0.071 Chad 0.151 0.831 Stephen 0.750 0.653 至： 1_Ryan 1_Chad 1_Stephen 2_Ryan 2_Chad 2_Stephen 0.706 0.151 0.75 0.071 0.831 0.653 谢谢你的帮助！

阅读MS Excel的XML文件pandas数据框？: 我有一个MS Excel XML（2003）文件与以下元数据： <?xml version="1.0" encoding="UTF-8"?> <?mso-application progid="Excel.Sheet"?><Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet" xmlns:c="urn:schemas-microsoft-com:office:component:spreadsheet" xmlns:html="http://www.w3.org/TR/REC-html40" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet" xmlns:x2="http://schemas.microsoft.com/office/excel/2003/xml" xmlns:x="urn:schemas-microsoft-com:office:excel" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"><OfficeDocumentSettings xmlns="urn:schemas-microsoft-com:office:office"> 我想把它读入一个pandas数据框。什么是这样做的好方法？谢谢。

pandas数据框从excel命名的范围: 有没有一种简单的方法来从一个命名的范围在Excel中的pandas数据框。 read_excel被devise为读取工作簿中的整个工作表。

Excel像pandas公式一样: 我有一个这种格式的pandas数据DataFrame User_id|2014-01|2014-02|2014-03|2014-04|2014-05|…|2014-12 1 | 7 | NaN | NaN | NaN | NaN |…| NaN 2 | NaN | 5 | NaN | NaN | 9 |…| NaN 3 | 2 | 4 | NaN | NaN | NaN |…| NaN 换句话说，列是几个月，索引是user_id ，每个单元格包含一个整数，或NaN 这些数字代表已采取的行动，如果在3个月之后，则认为行动是成功的，不需要采取其他行动。我的目标是find成功的行动清单在Excel中，我会写一个像这样的公式： Sheet2!E5=AND(Sheet1!E5<>"NaN",Sheet1!D5="NaN",Sheet1!C5="NaN",Sheet1!B5="NaN") 然后将它拖到其余的列，然后我会有一个指标，行动是否成功。怎样才能有效地完成大pandas？示例输出：对于上面给出的例子，期望的输出应该是： User_id|2014-01|2014-02|2014-03|2014-04|2014-05| 1 | T […]