用pandas处理Excel文件
我试图读Pandas
的Excel文件。
-
我只想读第2列到第4列。
-
我试图跳过前9行的阅读。
- 即使使用
skiprows=8, parse_col=["B:D"],
存储在df
数据看起来与传入的excel文件相同,并且不排除前9行或排除期望的列。
我的语法有什么问题,为什么不是数据库结构存储在df
input的Excel文件减去9行和几列?
我的传入数据如下:
Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,String1,String2,Null,Null,Null Null,Phase to Phase Voltage,A - B,210.0,C - A,211.0,B - C,212.0 Null,Circuit/Breaker,Number,Internal Meter Amps,External Meter Amps,Measured Difference,% Difference,Location Identifier,Total Location Amperage,Comments Null,Main Phase A,94.1,96.,2.8,3%,Null,Null,Null Null,Main Phase B,90.1,92.6,2.5,3%,Null,Null,Null Null,Main Phase C,91.9,92.1,0.2,0%,Null,Null,Null Null,Neutral,0.0,0.4,0.4,100%,Null,Null,Null Null,Ground 0.0,0.1,0.1,100%,Null,Null,Null Null,1,10.6,10.2,-0.4,-4%,Null,Null,Null Null,2,10.6,10.3,-0.3,-3%,Null,Null,Null ....
我的代码如下:
import pandas as pd df = pd.read_excel('filelocation.xlsx', sheetname=['pnl1 Data ','pnl2 Data','pnl3 Data','pnl4 Data'], skiprows=8, parse_col=["B:D"], keep_default_na='FALSE', na_values=['NULL'])
您拼错了parse_cols
参数名称,请使用parse_cols
而不是parse_col
。 除此之外,你应该指定一个像"B:D"
(或"B,C,D"
)或像['B','C','D']
尝试这个:
import pandas as pd df = pd.read_excel('filelocation.xlsx', sheetname=['pnl1 Data ','pnl2 Data','pnl3 Data','pnl4 Data'], skiprows=8, parse_cols="B:D", keep_default_na='FALSE', na_values=['NULL'])
PS也检查这个sheet_name: 'pnl1 Data '
尾随空间