Tag: pandas

Python Pandas XlsxWriter中心全面select

背景信息 我有一个脚本,适用于创build合并标题,但我需要中心select而不是合并。 我遵循官方文件,但它不起作用。 我已经尝试了大量的可能的组合,其中一些我在下面的图片中包含。 任何帮助将不胜感激。 码 我编写了代码,只要将其粘贴到xlsFilepath 。 现在,我只是简单地对文本进行硬编码,以便简化select,但理想情况下我要将其更改为Titlevariables。 import pandas as pd import numpy as np #Create a random dataframe for this example All_Columns_DF = pd.DataFrame(np.random.randn(100, 3), columns=['Title', 'Col_A' ,'Col_B']) #Set file path for local machine xlsFilepath = r'H:\myfile.xlsx' #Create writer writer = pd.ExcelWriter(xlsFilepath, engine='xlsxwriter') #Write the DF to excel All_Columns_DF.to_excel(writer, startrow = 1, […]

当我使用pandas阅读.csv中的特定列时,会发生奇怪的跳跃

1.背景 我上传的.csv文件是一个示例文件,供我解释我的问题。 该文件包含中国所有城市的空气质量信息(代码代码)。 例如,列1001A表示一个城市,并且该列中的值表示对应于type列的空气污染物浓度。 我的问题 如果我想在20160205-00:00获得1014A城市的AQI值, 我只需要使用 df = pd.read_csv("./this file") aqi = df["1014A"].iloc[0] 结果是42 。 但是在LibraOffice中查看同样的文件,结果如下所示: pandas看起来像读了1013A ,并犯了错误。 所以我想弄清楚1013A发生了什么: 大pandas阅读这个列(里面有有限的值)作为NaN值列。 在这个文件中发生了很多次。 它在以下方面困扰我: 一些有数据的列在pandas.Dataframe中被当作NaN列 其他列也会间接受到Error-NaN列的影响。 如果这个问题没有得到解决,那么列位置就会充满错误。 任何意见将不胜感激!

pandas:to_excel():如何将时间表示为TimeSeries索引的格式?

我有一个index的DataFrame: Index([00:00:00, 00:05:00, 00:10:00, 00:15:00, 00:20:00, 00:25:00, 00:30:00, 00:35:00, 00:40:00, 00:45:00, … 23:10:00, 23:15:00, 23:20:00, 23:25:00, 23:30:00, 23:35:00, 23:40:00, 23:45:00, 23:50:00, 23:55:00], dtype='object', length=288) 我把这个df写成excel如下: writer = pd.ExcelWriter("output.xlsx") df.set_index(index, inplace=True) df.to_excel(writer, sheet_name="Days") writer.save() 但是,当我打开,看看Excel的内容,我看到这个: 该索引显示为浮点数字。 如果我格式的Excel单元格的时间,然后我看到它是这样的: 我不喜欢每次打开它们时手动格式化表格,所以,在创buildExcel文件时是否有表示格式的方法?

如何正确parsing为文本数字在Excel中使用Python混合逗号和点分隔?

我正在导入来自另一个办公室的excel文件。 在其中一列中,对于每个单元格,我都有用作标记的数字列表。 这些手动插入,由不同的人和(我的猜测)使用不同的数千个设置的计算机,所以结果是非常不同的。 作为一个例子,我有: tags= ['205', '306.3', '3,206,302','7.205.206'] 如果这是一个CSV文件(我试图转换一个单一的文件来检查),使用 pd.read_csv(my_file,sep=';') 会给我完全上面提到的名单。 不幸的是,如上所述,我们正在讨论excel文件(复数),我必须处理它,并使用 pd.read_excel(my_file,sheetname=my_sheet,encoding='utf-16',converters{'my_column':str}) 我得到的是: tags= ['205', '306.3', '3,206,302','7205206'] 正如你所看到的,只要数字可以用数以千计的逻辑表示(所以,不是我列表中的第二个数字),点被识别为千位分隔符,而我得到一个单一的数字,而不是三个。 我尝试阅读文档,searchstackoverflow和谷歌,但关键字来描述这个问题太模糊,我还没有find一个可行的解决scheme。 我怎样才能得到正确的清单使用Excel文件? 谢谢。

在pandas excel工作表上附加多种样式

PandasWriter = pandas.ExcelWriter(self.sio, engine='xlsxwriter') workbook = PandasWriter.book worksheet = PandasWriter.sheets['Sheet1'] black_shade = workbook.add_format({'bg_color':'#f6f7f8'}) bold = workboot.add_format({'bold': True}) worksheet.set_columns('A:C',None, black_shade) worksheet.set_rows(20, None, bold) 需要有A20单元有black_shade和大胆。 我如何追加两种格式。 在列上设置的格式被行上的格式replace。

从密码保护的Excel文件到pandas数据框

我可以用这个打开密码保护的Excel文件: import sys import win32com.client xlApp = win32com.client.Dispatch("Excel.Application") print "Excel library version:", xlApp.Version filename, password = sys.argv[1:3] xlwb = xlApp.Workbooks.Open(filename, Password=password) # xlwb = xlApp.Workbooks.Open(filename) xlws = xlwb.Sheets(1) # counts from 1, not from 0 print xlws.Name print xlws.Cells(1, 1) # that's A1 我不确定如何将信息传输到pandas数据框。 我是否需要一个一个地阅读单元格,还是有一个方便的方法来实现?

Xlsxwriter将不同的格式写入同一列中的不同单元格

设置不同单元格的格式时遇到问题。 我有两个数据框,其中包含应以不同格式显示的数字。 我创build了一个简单的例子来显示我的问题。 import pandas as pd import numpy as np import xlsxwriter frame1 = pd.DataFrame(np.random.randint(0,100,size=(10, 4)), columns=list('ABCD')) #want to show this frame as percentage in Excel later frame2 = pd.DataFrame(np.random.randint(0,100,size=(10, 4)), columns=list('EFGH')) writer = pd.ExcelWriter('test.xlsx', engine='xlsxwriter') frame1.to_excel(writer, sheet_name='Sheet1', startcol= 0, startrow= 0) frame2.to_excel(writer, sheet_name='Sheet1', startcol= 0, startrow = (2 + len(frame1))) writer.save() 此代码生成此Excel表单: 现在的问题是,我可能想要设置标记为黄色的单元格为%或其他格式。 […]

连接excel数据与python或Excel

这是我的问题,我有一个Excel工作表2列(见下文) 我想打印(在Python的控制台或在Excel单元格)在这种forms下的所有数据: "1" : ["1123","1165", "1143", "1091", "n"], *** n ∈ [A2; A205]*** 我们并不关心B列,但是我需要在这个特定的表格下添加每个邮政编码。 有没有办法用Excel或Python与pandas? (如果你有任何其他的想法,我很乐意听到他们) 干杯

匹配列名称不同的2个Excel表格的数据

我有两个Excel表格都放入pandas数据框。 例如: 1.csv EmployeeID | DOB | Age A | 12/11/1978 | 2 B | 12/09/1988 | 8 C | 12/02/1985 | 20 D | 11/11/1990 | 25 2.csv MemberIdentifier| DateofBirth| YOW A | 12/11/1978 | 2 B | 12/09/1988 | 8 C | 12/02/1985 | 20 result.csv EmployeeID | MemberIdentifier | DOB |DateofBirth| Exp […]

将pandas.DataFrame添加到现有的Excel文件

我有一个网站刮板,为本月的刮伤创build一个excel文件。 我想在每次运行的时候,把当天的刮刮器和每一个刮刮器都添加到这个文件中作为新的纸张。 然而,我的问题是,它只是用新的工作表覆盖现有工作表,而不是将其作为单独的新工作表添加。 我试着用xlrd,xlwt,pandas和openpyxl来做。 还是崭新的Python,所以简单的赞赏! 下面是处理写入excel文件的代码。 # My relevant time variables ts = time.time() date_time = datetime.datetime.fromtimestamp(ts).strftime('%y-%m-%d %H_%M_%S') HourMinuteSecond = datetime.datetime.fromtimestamp(ts).strftime('%H_%M_%S') month = datetime.datetime.now().strftime('%m-%y') # Creates a writer for this month and year writer = pd.ExcelWriter( 'C:\\Users\\G\\Desktop\\KickstarterLinks(%s).xlsx' % (month), engine='xlsxwriter') # Creates dataframe from my data, d df = pd.DataFrame(d) # Writes to the excel […]