用pandas处理Excel文件

我试图读Pandas的Excel文件。

  1. 我只想读第2列到第4列。

  2. 我试图跳过前9行的阅读。

  3. 即使使用skiprows=8, parse_col=["B:D"],存储在df数据看起来与传入的excel文件相同,并且不排除前9行或排除期望的列。

我的语法有什么问题,为什么不是数据库结构存储在dfinput的Excel文件减去9行和几列?

我的传入数据如下:

 Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,String1,String2,Null,Null,Null Null,Phase to Phase Voltage,A - B,210.0,C - A,211.0,B - C,212.0 Null,Circuit/Breaker,Number,Internal Meter Amps,External Meter Amps,Measured Difference,% Difference,Location Identifier,Total Location Amperage,Comments Null,Main Phase A,94.1,96.,2.8,3%,Null,Null,Null Null,Main Phase B,90.1,92.6,2.5,3%,Null,Null,Null Null,Main Phase C,91.9,92.1,0.2,0%,Null,Null,Null Null,Neutral,0.0,0.4,0.4,100%,Null,Null,Null Null,Ground 0.0,0.1,0.1,100%,Null,Null,Null Null,1,10.6,10.2,-0.4,-4%,Null,Null,Null Null,2,10.6,10.3,-0.3,-3%,Null,Null,Null .... 

我的代码如下:

 import pandas as pd df = pd.read_excel('filelocation.xlsx', sheetname=['pnl1 Data ','pnl2 Data','pnl3 Data','pnl4 Data'], skiprows=8, parse_col=["B:D"], keep_default_na='FALSE', na_values=['NULL']) 

您拼错了parse_cols参数名称,请使用parse_cols而不是parse_col 。 除此之外,你应该指定一个像"B:D" (或"B,C,D" )或像['B','C','D']

尝试这个:

 import pandas as pd df = pd.read_excel('filelocation.xlsx', sheetname=['pnl1 Data ','pnl2 Data','pnl3 Data','pnl4 Data'], skiprows=8, parse_cols="B:D", keep_default_na='FALSE', na_values=['NULL']) 

PS也检查这个sheet_name: 'pnl1 Data '尾随空间