滴“#NULL!” 从df
我正在尝试导入一些简单的likert数据,并使用堆叠的水平条形图进行绘图。
import pandas as pd path = "C:\\..." datafile_name = "Motivators.xlsx" datafile = path + datafile_name xls_file = pd.ExcelFile(datafile) df = xls_file.parse('Sheet1') df = df.drop('Email_Address', 1) print df[:10] df.plot(kind='barh', stacked=True)
我不知道pd.ExcelFile()
是如何工作的,但是有一个选项用于pd.ExcelFile()
#NULL!
值?
我有#NULL!
条logging#NULL!
项
更换#NULL!
与NaN
和然后dropna
。
In [1]: df = pd.DataFrame([1, 2, 3, "#NULL!"]) In [2]: df Out[2]: 0 0 1 1 2 2 3 3 #NULL! [4 rows x 1 columns] In [3]: df.replace('#NULL!', np.nan) Out[3]: 0 0 1 1 2 2 3 3 NaN [4 rows x 1 columns] In [4]: df.replace('#NULL!', np.nan).dropna() Out[4]: 0 0 1 1 2 2 3 [3 rows x 1 columns]
更好的是指定#NULL!
是用na_values='#NULL!'
导入时的NaN na_values='#NULL!'
在pd.read_excel()
。