Tag: pandas

Python Pandas XlsxWriter中心全面select: 背景信息我有一个脚本，适用于创build合并标题，但我需要中心select而不是合并。我遵循官方文件，但它不起作用。我已经尝试了大量的可能的组合，其中一些我在下面的图片中包含。任何帮助将不胜感激。码我编写了代码，只要将其粘贴到xlsFilepath 。现在，我只是简单地对文本进行硬编码，以便简化select，但理想情况下我要将其更改为Titlevariables。 import pandas as pd import numpy as np #Create a random dataframe for this example All_Columns_DF = pd.DataFrame(np.random.randn(100, 3), columns=['Title', 'Col_A' ,'Col_B']) #Set file path for local machine xlsFilepath = r'H:\myfile.xlsx' #Create writer writer = pd.ExcelWriter(xlsFilepath, engine='xlsxwriter') #Write the DF to excel All_Columns_DF.to_excel(writer, startrow = 1, […]

当我使用pandas阅读.csv中的特定列时，会发生奇怪的跳跃: 1.背景我上传的.csv文件是一个示例文件，供我解释我的问题。该文件包含中国所有城市的空气质量信息（代码代码）。例如，列1001A表示一个城市，并且该列中的值表示对应于type列的空气污染物浓度。我的问题如果我想在20160205-00：00获得1014A城市的AQI值，我只需要使用 df = pd.read_csv("./this file") aqi = df["1014A"].iloc[0] 结果是42 。但是在LibraOffice中查看同样的文件，结果如下所示： pandas看起来像读了1013A ，并犯了错误。所以我想弄清楚1013A发生了什么：大pandas阅读这个列（里面有有限的值）作为NaN值列。在这个文件中发生了很多次。它在以下方面困扰我：一些有数据的列在pandas.Dataframe中被当作NaN列其他列也会间接受到Error-NaN列的影响。如果这个问题没有得到解决，那么列位置就会充满错误。任何意见将不胜感激！

pandas：to_excel（）：如何将时间表示为TimeSeries索引的格式？: 我有一个index的DataFrame： Index([00:00:00, 00:05:00, 00:10:00, 00:15:00, 00:20:00, 00:25:00, 00:30:00, 00:35:00, 00:40:00, 00:45:00, … 23:10:00, 23:15:00, 23:20:00, 23:25:00, 23:30:00, 23:35:00, 23:40:00, 23:45:00, 23:50:00, 23:55:00], dtype='object', length=288) 我把这个df写成excel如下： writer = pd.ExcelWriter("output.xlsx") df.set_index(index, inplace=True) df.to_excel(writer, sheet_name="Days") writer.save() 但是，当我打开，看看Excel的内容，我看到这个：该索引显示为浮点数字。如果我格式的Excel单元格的时间，然后我看到它是这样的：我不喜欢每次打开它们时手动格式化表格，所以，在创buildExcel文件时是否有表示格式的方法？

如何正确parsing为文本数字在Excel中使用Python混合逗号和点分隔？: 我正在导入来自另一个办公室的excel文件。在其中一列中，对于每个单元格，我都有用作标记的数字列表。这些手动插入，由不同的人和（我的猜测）使用不同的数千个设置的计算机，所以结果是非常不同的。作为一个例子，我有： tags= ['205', '306.3', '3,206,302','7.205.206'] 如果这是一个CSV文件（我试图转换一个单一的文件来检查），使用 pd.read_csv(my_file,sep=';') 会给我完全上面提到的名单。不幸的是，如上所述，我们正在讨论excel文件（复数），我必须处理它，并使用 pd.read_excel(my_file,sheetname=my_sheet,encoding='utf-16',converters{'my_column':str}) 我得到的是： tags= ['205', '306.3', '3,206,302','7205206'] 正如你所看到的，只要数字可以用数以千计的逻辑表示（所以，不是我列表中的第二个数字），点被识别为千位分隔符，而我得到一个单一的数字，而不是三个。我尝试阅读文档，searchstackoverflow和谷歌，但关键字来描述这个问题太模糊，我还没有find一个可行的解决scheme。我怎样才能得到正确的清单使用Excel文件？谢谢。

在pandas excel工作表上附加多种样式: PandasWriter = pandas.ExcelWriter(self.sio, engine='xlsxwriter') workbook = PandasWriter.book worksheet = PandasWriter.sheets['Sheet1'] black_shade = workbook.add_format({'bg_color':'#f6f7f8'}) bold = workboot.add_format({'bold': True}) worksheet.set_columns('A:C',None, black_shade) worksheet.set_rows(20, None, bold) 需要有A20单元有black_shade和大胆。我如何追加两种格式。在列上设置的格式被行上的格式replace。

从密码保护的Excel文件到pandas数据框: 我可以用这个打开密码保护的Excel文件： import sys import win32com.client xlApp = win32com.client.Dispatch("Excel.Application") print "Excel library version:", xlApp.Version filename, password = sys.argv[1:3] xlwb = xlApp.Workbooks.Open(filename, Password=password) # xlwb = xlApp.Workbooks.Open(filename) xlws = xlwb.Sheets(1) # counts from 1, not from 0 print xlws.Name print xlws.Cells(1, 1) # that's A1 我不确定如何将信息传输到pandas数据框。我是否需要一个一个地阅读单元格，还是有一个方便的方法来实现？

Xlsxwriter将不同的格式写入同一列中的不同单元格: 设置不同单元格的格式时遇到问题。我有两个数据框，其中包含应以不同格式显示的数字。我创build了一个简单的例子来显示我的问题。 import pandas as pd import numpy as np import xlsxwriter frame1 = pd.DataFrame(np.random.randint(0,100,size=(10, 4)), columns=list('ABCD')) #want to show this frame as percentage in Excel later frame2 = pd.DataFrame(np.random.randint(0,100,size=(10, 4)), columns=list('EFGH')) writer = pd.ExcelWriter('test.xlsx', engine='xlsxwriter') frame1.to_excel(writer, sheet_name='Sheet1', startcol= 0, startrow= 0) frame2.to_excel(writer, sheet_name='Sheet1', startcol= 0, startrow = (2 + len(frame1))) writer.save() 此代码生成此Excel表单：现在的问题是，我可能想要设置标记为黄色的单元格为％或其他格式。 […]

连接excel数据与python或Excel: 这是我的问题，我有一个Excel工作表2列（见下文）我想打印（在Python的控制台或在Excel单元格）在这种forms下的所有数据： "1" : ["1123","1165", "1143", "1091", "n"], *** n ∈ [A2; A205]*** 我们并不关心B列，但是我需要在这个特定的表格下添加每个邮政编码。有没有办法用Excel或Python与pandas？（如果你有任何其他的想法，我很乐意听到他们）干杯

匹配列名称不同的2个Excel表格的数据: 我有两个Excel表格都放入pandas数据框。例如： 1.csv EmployeeID | DOB | Age A | 12/11/1978 | 2 B | 12/09/1988 | 8 C | 12/02/1985 | 20 D | 11/11/1990 | 25 2.csv MemberIdentifier| DateofBirth| YOW A | 12/11/1978 | 2 B | 12/09/1988 | 8 C | 12/02/1985 | 20 result.csv EmployeeID | MemberIdentifier | DOB |DateofBirth| Exp […]

将pandas.DataFrame添加到现有的Excel文件: 我有一个网站刮板，为本月的刮伤创build一个excel文件。我想在每次运行的时候，把当天的刮刮器和每一个刮刮器都添加到这个文件中作为新的纸张。然而，我的问题是，它只是用新的工作表覆盖现有工作表，而不是将其作为单独的新工作表添加。我试着用xlrd，xlwt，pandas和openpyxl来做。还是崭新的Python，所以简单的赞赏！下面是处理写入excel文件的代码。 # My relevant time variables ts = time.time() date_time = datetime.datetime.fromtimestamp(ts).strftime('%y-%m-%d %H_%M_%S') HourMinuteSecond = datetime.datetime.fromtimestamp(ts).strftime('%H_%M_%S') month = datetime.datetime.now().strftime('%m-%y') # Creates a writer for this month and year writer = pd.ExcelWriter( 'C:\\Users\\G\\Desktop\\KickstarterLinks(%s).xlsx' % (month), engine='xlsxwriter') # Creates dataframe from my data, d df = pd.DataFrame(d) # Writes to the excel […]