Tag: pandas

Pandas – Excel导入 – Python – Glob,如何在导入中放置stringvariables

我试图导入位于映射到我的本地Z驱动器的位置的Excel文件。 该位置包含许多文件。 我正在寻找只加载那些在标题中包含昨天的date..做到这一点我到目前为止: import glob import pandas as pd from datetime import date, timedelta yesterday = date.today() – timedelta(1) yesterday = yesterday.strftime('-%m-%d-%y') all_data = pd.DataFrame() for f in glob.glob('Z:*[yesterday]*'): df = pd.read_excel(f) all_data = all_data.append(df,ignore_index=True)` 但是,试图导入时不会调用variables“昨天”。 我知道我的语法一定是错的,因为所有文件都被调用。 如何在导入条件中包含“昨天”?

用不同的数据写两个数据框到一个excel文件。 pandas

这可能是一个奇怪的问题,但我试图写一些数据到Excel工作表,以便从另一个工作表中读入数据。 我现在已经build立了,所以我可以写一个DataFrame并根据这些信息改变单元格的颜色。 现在我想在保持颜色的同时在这些单元格中添加新的信息。 import pandas as pd, datetime as dt import glob, os import math runDir = "/Users/AaronsMac/Documents/" if os.getcwd() != runDir: os.chdir(runDir) files = glob.glob("edcLineup_*.xlsx") schedule = glob.glob("edcSetTime*.xlsx") print schedule for each in files: sheets = pd.ExcelFile(each).sheet_names sheets = sorted(sheets) df = {} for sheet in sheets: df = pd.read_excel(each, sheet, index_col='Artists') #print df […]

使用xlwt将公式写入Excel表格后,用xlrd读取具有公式的单元格将返回空白

我首先用pandas创build了一个数据透视表。 然后我将它保存到工作表中。 然后,我使用xlwt在本工作表中编写了一些数据和公式,以便进一步处理。 现在我正试图从我之前写过一个公式的单元格中读取值。 book = xlrd.open_workbook(fname) sheet = book.sheet_by_name('Pivot Table') print 'Spare',sheet.cell(11,10).value 此代码工作正常,并指向没有公式(取决于其他单元格)的单元格时返回适当的值。 但是具有公式的单元格没有任何返回 我需要一种方法来读取单元格的值。 Excel工作表有很多公式写入它,我试图读取的单元格是最后的单元格。 所以我不想回溯过程来获得价值(通过我的脚本计算)。 我使用Ubuntu和LibreOffice。 (仅供参考,如果没有直接的方法,我们需要打开excel并获取数据)

从Excel中拖动date和时间到pandas,并将其结合到时间戳

最终编辑(希望):哦,我的上帝,你解决了它! 升级到pandas0.15.2后,这个解决scheme似乎工作: trades['OEDatum'] = (trades[['OEDatum', 'OEUhrzeit']].apply (lambda x: dt.datetime.combine (x['OEDatum'].date(), x['OEUhrzeit']), axis=1)) 非常感谢@EDChum和@joris 我试图通过read_excel将一些Excelsheet中的数据放入Pandas数据框中: Asset OEDatum OEUhrzeit ODatum OUhrzeit L/S Entrykurs \ Trade 1 EURUSD 2014-06-12 12:00:00 2014-06-12 12:23:09 L 1.2456 2 USDJPY 2014-11-11 10:15:35 2014-11-11 10:34:50 S 126.6300 3 EURJPY 2014-12-23 13:15:24 2014-12-23 13:25:45 L 114.4600 4 GBPJPY 2014-12-23 14:27:36 2014-12-23 14:35:56 S 156.6000 […]

Excel中pandas的公式评估

说我有一个这样的字典,其关键是Excel中的单元格引用,值是公式或整数。 input_dict = { "B25": "=B2*B4", "C25": "=C2*C4", "D25": "=D2*D4", "E25": "=E2*E4", "F25": "=F2*F4", "G25": "=G2*G4", "B22": 0, "C22": "=SUM(B22:B28)", "D22": "=SUM(C22:C28)", "E22": "=SUM(D22:D28)", "F22": "=SUM(E22:E28)", "G22": "=SUM(F22:F28)", "B28": "=B19*B20*B22", "C28": "=C19*C20*C22", "D28": "=D19*D20*D22", "E28": "=E19*E20*E22", "F28": "=F19*F20*F22", "G28": "=G19*G20*G22", "B2": 1000, "C2": 900, "D2": 880, "E2": 860, "F2": 840, "G2": 800, "B4": 0.95, "C4": […]

pandasdataframe列中变长模式的检测

时间序列索引dataframe的最后2列标识开始('A'或'AA'或'AAA'),结束('F'或'FF'或'FFF')和持续时间(开始和结束之间的行数)的一个物理过程,他们看起来像这样: AF序列或它们之间的n个序列长度可变。 我怎样才能识别这些模式,并为他们每个人计算相应行的其他列的平均值? 我非常非常想做的是: import pandas as pd import xlrd ##### EXCEL LOAD filepath= 'H:\\CCGT GE startup.xlsx' df = pd.read_excel(filepath,sheet_name='Sheet1',header=0,skiprows=0,parse_cols='A:CO',index_col=0) df = df.sort_index() # set increasing time index, source data is time decreasing gas=[] for i,row in df.iterrows(): if df['FLAG STARTUP TG1'] is not 'n': while 'F' not in df['FLAG STARTUP TG1']: gas.append(df['PORTATA GREZZA TG1 […]

链接数据框和Excel数据

我正在尝试为模拟创build一些参数,但是我正努力将所有的数据放在一起。 我的数据来自: df1 = pd.read_csv(file1) TurnDatabase = tkFileDialog.askopenfilename(title='choose file') 然后从不重要的数据中挑选一圈。 我遇到的麻烦是当我试图从CSV文件中获取数据时 'BCornerEntry' == 'YES' 而excel表单中的'sLap'与CSV相同。 Excel文档有这样一个表格: 打开数字,input,退出 1 321 546 2 789 1002 3 1230 1567 等等。 入口和出口在某一点上与sLap相同。 我有 我用这个来隔离轨道的边angular以及条件是否正确。 Entries1 = {i: df1.TurnData1[i][(df1.TurnData1[i]['BCornerEntry'] == "YES") & (df1.TurnData1[i]['NLap'] == Lap1)] for i in df1.TurnData1.viewkeys()} TurnData1来自这里: TurnInfo = TurnInfo.dropna(axis=1) # Split the data up into each […]

使用pandas写入excel表。 在总结两栏和新增栏目方面

我正试图在我的excel表上总结两列。 当我打印DF。[总]的值是正确的。 但不会在Excel电子表格中写入新列。 我怎么能这样做? 这里是我的Excel表单包括: Jan |Feb 10000 |62000 95000 |45000 91000 |120000 45000 |120000 162000 |120000 目标:将这两个值相加并写出所得总和的新和列。 并得到我的Excel电子表格: Jan |Feb |Sums 10000 |62000| 72000 95000 |45000|140000 91000 |120000 |211000 45000 |120000 | 165000 162000 |120000 | 282000 这是我的代码: import pandas as pd import numpy as np from pandas import ExcelWriter df = pd.read_excel("samplesheet.xlsx") df["total"] […]

从Python中的Excel加载项运行函数

我想在Excel中使用加载项的函数,并将其应用于我在python中模拟的一些数据。 有没有可以实现这个目标的模块? 到目前为止,我有一些代码在数据框中生成一堆数据 C1 C2 C3 nC4 iC4 nC5 iC5 neoC5 N2 0 90.34364577 5.501069076 3.904211384 0.007948769 0.057467208 0.000466526 0.034502231 0.008775129 0.141913909 1 79.87947438 12.95362252 3.845030371 1.445818316 0.526220788 0.072494231 0.010549205 0.007833261 1.25895692 2 86.60782828 11.13247803 0.359881389 0.457152395 0.042235431 0.073007703 0.047842406 0.008097507 1.271476856 3 90.74757241 3.788506107 3.569925633 1.392985625 0.072023898 0.022338002 0.012729554 0.008827255 0.385091513 4 88.60924681 10.01256459 […]

pandas有智能数据读取function吗?

我通常使用pandas.read_csv从文件中获取数据。 当我使用这个函数时,我需要设置一个分隔符并指定文件中是否有标题。 有没有办法将这些任务传递给程序? 如果有标题和使用什么分隔符,不能编程找出自己? 如果有可能,我想进一步。 该函数本身不能找出存储date的格式,然后将所有的date作为date对象? 如果用户可以使用文件名作为唯一参数调用read_data函数并获取数据,那将是理想的。 该函数应该自动使用适当的较低级读取和parsing函数来读取正在读取的数据types。 它应该适用于CSV文件或Excel文件中的数据。 这个方向有什么东西吗?