Tag: pandas

滴“#NULL!” 从df

我正在尝试导入一些简单的likert数据,并使用堆叠的水平条形图进行绘图。 import pandas as pd path = "C:\\…" datafile_name = "Motivators.xlsx" datafile = path + datafile_name xls_file = pd.ExcelFile(datafile) df = xls_file.parse('Sheet1') df = df.drop('Email_Address', 1) print df[:10] df.plot(kind='barh', stacked=True) 我不知道pd.ExcelFile()是如何工作的,但是有一个选项用于pd.ExcelFile() #NULL! 值? 我有#NULL!条logging#NULL! 项

在Python(或Excel)中同步数据

我经常使用Python(偶尔Excel)来处理和比较多个实验之间的testing数据。 在某些情况下,数据可能不同步,这使得直接比较困难。 例如,典型的testing规范是: 1) Stabilize test temperature to a value of 20 +/- 2 degrees C 2) Hold test temperature at stabilized value for 15-25 seconds 3) Increase temperature by 20 degrees C at a rate of 0.5 degree C/second 对数据进行归一化是非常简单的,因此它们在时间= 0秒时都以20℃的标称温度值开始,但是我真正想要的是同步数据,使得温度斜坡同时开始。 我已经尝试了简单的algorithm来检查数据的斜率,以确定何时开始温度boost,但由于仪器导致的测量结果的局部波动导致的斜率实际上并不能反映整体温度变化率。 在Numpy,Scipy,Pandas等有function可以过滤掉这些局部波动,并确定何时实际开始增加温度。 我偶尔会在Excel中工作,所以如果在电子表格中有更方便的方法,我可以使用Excel来处理数据。 任何build议,将不胜感激。

不发送与Postgres – Pandas相关的密码

我想读一个Excel表格到pandas,然后将表单传递给一个新的尚未创build的PostgreSQL数据库。 根据文档构build我的urlhttp://docs.sqlalchemy.org/en/rel_1_0/core/engines.html#postgresql ,我正在使用实用助手来确定数据库是否存在。 所以这是我的代码(Python 3) import pandas as pd # import sqlite3 # con = sqlite3.connect(':memory:') import psycopg2 from sqlalchemy import create_engine from sqlalchemy_utils import database_exists, create_database xls = pd.ExcelFile('C:/Users/sayth/Downloads/June_TSO_Coaching/book2.xlsx') data = xls.parse('ThisOne', index_col=None, na_values=['NA']) engine = create_engine("postgres://localhost/mydb") if database_exists(engine.url): engine = create_engine('postgresql://postgres:mypass@localhost/mydb') data.to_sql('data',engine) else: create_database(engine.url) print("Created" + engine.url) # data.to_sql('data', con) pd.read_sql_query("SELECT * FROM […]

如何把一个数据框转换成一个Pythonpandas的特定规格的数组

我很难弄清楚如何将我的excel电子表格df [50]中的特定数据框转换为具有某些规范的数据框。 (我不想第一个值进入数组)。 例如df [50]包括: 打印(DF [50]) 0 50 1 29.52 2 29.97 3 29.52 4 29.97 5 31.5 6 33.93 7 36.54 8 34.02 9 33.48 10 32.04 11 33.03 12 35.01 我想要的是: [29.52, 29.97, 29.52, 29.97, 31.5, 33.93, 36.54, 34.02, 33.48, 32.04, 33.03, 35.01] 我将如何去跳过第一个值? 谢谢。

使用Python将日常数据结合到Excel中的每月数据中

我想弄清楚如何将每日date合并到特定的月份,并且总结每个月的数据。 注:我有一个很大的列表,每天的date,但我把一个小样本在这里简单的例子。 文件名:(test.xlsx) 对于示例(工作表1)以数据框模式包含: DATE 51 52 53 54 55 56 0 20110706 28.52 27.52 26.52 25.52 24.52 23.52 1 20110707 28.97 27.97 26.97 25.97 24.97 23.97 2 20110708 28.52 27.52 26.52 25.52 24.52 23.52 3 20110709 28.97 27.97 26.97 25.97 24.97 23.97 4 20110710 30.5 29.5 28.5 27.5 26.5 25.5 5 20110711 32.93 31.93 […]

用Pandas在Excel中读取删除线

有没有办法让我在不使用VBA的情况下阅读pandas的删除线? 我有一个电子表格,一个人拒绝使用其他任何东西。 先谢谢了!

整个表单放入xlwings的pandas数据框中

感谢pandas,我们可以用“read_excel”函数将整个表格读入数据框。 我想用xlwings使用相同的方法。 实际上,我的工作簿已经打开了,我不想使用read_excel函数(这样做会花费太长的时间来执行),而是使用xlwings的强大function将整个工作表保存到数据框中。 事实上,我们可以将xlwings的范围保存到一个数据框中。 这意味着我必须知道范围的大小。 但是我想有一种更好(更快)的方式来做到这一点,不是吗? 你有什么想法做到这一点? 非常感谢 ! 编辑:我希望作为read_excel转移到一个数据框的一个例子将做到这一点。 Name Point Time Power Test1 Test2 Test3 Test4 ## Test 0 1 10 4 24 144 2 20 8 48 288 3 30 12 72 432 4 40 16 96 576 5 50 20 120 720 6 60 24 144 864 7 70 28 168 […]

将openpyxl数据传递给pandas

我从excel文件的数据中将“全名”字段拆分为“名字”,“中间名”和“姓氏”字段,我不知道如何在pandas中这样做,所以我转向了openpyxl。得到的variables分裂,因为我想要的。但是, 因为添加列到openpyxl的新领域是不容易的 ,我想我会传递给pandas的值。 我运行代码时生成了我需要的数据框,但是一旦将df发送到ExcelWriter,只有最后一行被添加到Excel文件中。 数据是在正确的地方,但。 代码如下: for cellObj in range(2, sheet.max_row+1): #print cellObj id = sheet['A' + str(cellObj)].value fullname = sheet['B' + str(cellObj)].value.strip() namelist = fullname.split(' ') for i in namelist: firstname = namelist[0] if len(namelist) == 2: lastname = namelist[1] middlename = '' elif len(namelist) == 3: middlename = namelist[1] lastname = namelist[2] elif […]

如何在xlsx文件中获取当前行并将其分割为前一个?

我正在使用这个class来写入xlsx文件中的统计信息: class DictWriter: def __init__(self, workbook, worksheet, fieldnames): self.workbook = workbook self.worksheet = worksheet self.fieldnames = fieldnames self.nrow = 1 def writerow(self, d, condition=0): for k in d: ncol = self.fieldnames.index(k) self.worksheet.write(self.nrow, ncol, d[k]) self.nrow += 1 def writeheader(self): for ncol, fieldname in enumerate(self.fieldnames): self.worksheet.write(0, ncol, fieldname) 并以这种方式使用它: def file_generator(): link = "http://linkforexample.com/api/getSomething" client = […]

pandaspython和excel文件

我想写一个excel如下: <table> <tr> <td>user</td><td>4</td><td>Method</td><td>method 1</td> </tr> <tr> <td></td><td>title</td><td>note</td> </tr> <tr> <td></td><td>Hangover</td><td>7</td> </tr> <tr> <td></td><td>…</td><td>…</td> </tr> <tr> <td>user</td><td>4</td><td>Method</td><td>method 2</td> </tr> <tr> <td></td><td>title</td><td>note</td> </tr> <tr> <td></td><td>Lord of the ring</td><td>9</td> </tr> <tr> <td></td><td>…</td><td>…</td> </tr> </table> 所以我做了下面的代码: def get_users_recommandation(users, score_mpm_user, score_mpm_unique_user): writer = pd.ExcelWriter('recommendation.xlsx', engine='xlsxwriter') for user in users: label = pd.DataFrame({'user' : [user], 'method' : "mpm unique"}) label.to_excel(writer, […]