Tag: pandas

Pandas – Excel导入 – Python – Glob，如何在导入中放置stringvariables: 我试图导入位于映射到我的本地Z驱动器的位置的Excel文件。该位置包含许多文件。我正在寻找只加载那些在标题中包含昨天的date..做到这一点我到目前为止： import glob import pandas as pd from datetime import date, timedelta yesterday = date.today() – timedelta(1) yesterday = yesterday.strftime('-%m-%d-%y') all_data = pd.DataFrame() for f in glob.glob('Z:*[yesterday]*'): df = pd.read_excel(f) all_data = all_data.append(df,ignore_index=True)` 但是，试图导入时不会调用variables“昨天”。我知道我的语法一定是错的，因为所有文件都被调用。如何在导入条件中包含“昨天”？

用不同的数据写两个数据框到一个excel文件。 pandas: 这可能是一个奇怪的问题，但我试图写一些数据到Excel工作表，以便从另一个工作表中读入数据。我现在已经build立了，所以我可以写一个DataFrame并根据这些信息改变单元格的颜色。现在我想在保持颜色的同时在这些单元格中添加新的信息。 import pandas as pd, datetime as dt import glob, os import math runDir = "/Users/AaronsMac/Documents/" if os.getcwd() != runDir: os.chdir(runDir) files = glob.glob("edcLineup_*.xlsx") schedule = glob.glob("edcSetTime*.xlsx") print schedule for each in files: sheets = pd.ExcelFile(each).sheet_names sheets = sorted(sheets) df = {} for sheet in sheets: df = pd.read_excel(each, sheet, index_col='Artists') #print df […]

使用xlwt将公式写入Excel表格后，用xlrd读取具有公式的单元格将返回空白: 我首先用pandas创build了一个数据透视表。然后我将它保存到工作表中。然后，我使用xlwt在本工作表中编写了一些数据和公式，以便进一步处理。现在我正试图从我之前写过一个公式的单元格中读取值。 book = xlrd.open_workbook(fname) sheet = book.sheet_by_name('Pivot Table') print 'Spare',sheet.cell(11,10).value 此代码工作正常，并指向没有公式（取决于其他单元格）的单元格时返回适当的值。但是具有公式的单元格没有任何返回我需要一种方法来读取单元格的值。 Excel工作表有很多公式写入它，我试图读取的单元格是最后的单元格。所以我不想回溯过程来获得价值（通过我的脚本计算）。我使用Ubuntu和LibreOffice。（仅供参考，如果没有直接的方法，我们需要打开excel并获取数据）

从Excel中拖动date和时间到pandas，并将其结合到时间戳: 最终编辑（希望）：哦，我的上帝，你解决了它！升级到pandas0.15.2后，这个解决scheme似乎工作： trades['OEDatum'] = (trades[['OEDatum', 'OEUhrzeit']].apply (lambda x: dt.datetime.combine (x['OEDatum'].date(), x['OEUhrzeit']), axis=1)) 非常感谢@EDChum和@joris 我试图通过read_excel将一些Excelsheet中的数据放入Pandas数据框中： Asset OEDatum OEUhrzeit ODatum OUhrzeit L/S Entrykurs \ Trade 1 EURUSD 2014-06-12 12:00:00 2014-06-12 12:23:09 L 1.2456 2 USDJPY 2014-11-11 10:15:35 2014-11-11 10:34:50 S 126.6300 3 EURJPY 2014-12-23 13:15:24 2014-12-23 13:25:45 L 114.4600 4 GBPJPY 2014-12-23 14:27:36 2014-12-23 14:35:56 S 156.6000 […]

Excel中pandas的公式评估: 说我有一个这样的字典，其关键是Excel中的单元格引用，值是公式或整数。 input_dict = { "B25": "=B2*B4", "C25": "=C2*C4", "D25": "=D2*D4", "E25": "=E2*E4", "F25": "=F2*F4", "G25": "=G2*G4", "B22": 0, "C22": "=SUM(B22:B28)", "D22": "=SUM(C22:C28)", "E22": "=SUM(D22:D28)", "F22": "=SUM(E22:E28)", "G22": "=SUM(F22:F28)", "B28": "=B19*B20*B22", "C28": "=C19*C20*C22", "D28": "=D19*D20*D22", "E28": "=E19*E20*E22", "F28": "=F19*F20*F22", "G28": "=G19*G20*G22", "B2": 1000, "C2": 900, "D2": 880, "E2": 860, "F2": 840, "G2": 800, "B4": 0.95, "C4": […]

pandasdataframe列中变长模式的检测: 时间序列索引dataframe的最后2列标识开始（'A'或'AA'或'AAA'），结束（'F'或'FF'或'FFF'）和持续时间（开始和结束之间的行数）的一个物理过程，他们看起来像这样： AF序列或它们之间的n个序列长度可变。我怎样才能识别这些模式，并为他们每个人计算相应行的其他列的平均值？我非常非常想做的是： import pandas as pd import xlrd ##### EXCEL LOAD filepath= 'H:\\CCGT GE startup.xlsx' df = pd.read_excel(filepath,sheet_name='Sheet1',header=0,skiprows=0,parse_cols='A:CO',index_col=0) df = df.sort_index() # set increasing time index, source data is time decreasing gas=[] for i,row in df.iterrows(): if df['FLAG STARTUP TG1'] is not 'n': while 'F' not in df['FLAG STARTUP TG1']: gas.append(df['PORTATA GREZZA TG1 […]

链接数据框和Excel数据: 我正在尝试为模拟创build一些参数，但是我正努力将所有的数据放在一起。我的数据来自： df1 = pd.read_csv(file1) TurnDatabase = tkFileDialog.askopenfilename(title='choose file') 然后从不重要的数据中挑选一圈。我遇到的麻烦是当我试图从CSV文件中获取数据时 'BCornerEntry' == 'YES' 而excel表单中的'sLap'与CSV相同。 Excel文档有这样一个表格：打开数字，input，退出 1 321 546 2 789 1002 3 1230 1567 等等。入口和出口在某一点上与sLap相同。我有我用这个来隔离轨道的边angular以及条件是否正确。 Entries1 = {i: df1.TurnData1[i][(df1.TurnData1[i]['BCornerEntry'] == "YES") & (df1.TurnData1[i]['NLap'] == Lap1)] for i in df1.TurnData1.viewkeys()} TurnData1来自这里： TurnInfo = TurnInfo.dropna(axis=1) # Split the data up into each […]

使用pandas写入excel表。在总结两栏和新增栏目方面: 我正试图在我的excel表上总结两列。当我打印DF。[总]的值是正确的。但不会在Excel电子表格中写入新列。我怎么能这样做？这里是我的Excel表单包括： Jan |Feb 10000 |62000 95000 |45000 91000 |120000 45000 |120000 162000 |120000 目标：将这两个值相加并写出所得总和的新和列。并得到我的Excel电子表格： Jan |Feb |Sums 10000 |62000| 72000 95000 |45000|140000 91000 |120000 |211000 45000 |120000 | 165000 162000 |120000 | 282000 这是我的代码： import pandas as pd import numpy as np from pandas import ExcelWriter df = pd.read_excel("samplesheet.xlsx") df["total"] […]

从Python中的Excel加载项运行函数: 我想在Excel中使用加载项的函数，并将其应用于我在python中模拟的一些数据。有没有可以实现这个目标的模块？到目前为止，我有一些代码在数据框中生成一堆数据 C1 C2 C3 nC4 iC4 nC5 iC5 neoC5 N2 0 90.34364577 5.501069076 3.904211384 0.007948769 0.057467208 0.000466526 0.034502231 0.008775129 0.141913909 1 79.87947438 12.95362252 3.845030371 1.445818316 0.526220788 0.072494231 0.010549205 0.007833261 1.25895692 2 86.60782828 11.13247803 0.359881389 0.457152395 0.042235431 0.073007703 0.047842406 0.008097507 1.271476856 3 90.74757241 3.788506107 3.569925633 1.392985625 0.072023898 0.022338002 0.012729554 0.008827255 0.385091513 4 88.60924681 10.01256459 […]

pandas有智能数据读取function吗？: 我通常使用pandas.read_csv从文件中获取数据。当我使用这个函数时，我需要设置一个分隔符并指定文件中是否有标题。有没有办法将这些任务传递给程序？如果有标题和使用什么分隔符，不能编程找出自己？如果有可能，我想进一步。该函数本身不能找出存储date的格式，然后将所有的date作为date对象？如果用户可以使用文件名作为唯一参数调用read_data函数并获取数据，那将是理想的。该函数应该自动使用适当的较低级读取和parsing函数来读取正在读取的数据types。它应该适用于CSV文件或Excel文件中的数据。这个方向有什么东西吗？