无法在Python中读取所需的excel文件作为输出
我正在尝试阅读Python(2.7.13)中的excel文件。 为此,我创build了一个示例文件Book1,其中包含以下条目 –
import pandas as pd import numpy as np Book1 = pd.read_excel("D:\Python\Book1.xlsx") print(Book1.head())
在编写上述程序并在Powershell中执行后,我得到了下面的输出,我不明白。
第一列中的0,1,2是什么?为什么E的值从7变为7.1? 谁可以给我解释一下这个? 程序有问题吗?
我很抱歉如果上传的图片不适合在这里。 我不知道任何其他的方式来input这样的数据。
0,1,2是行索引,因为你没有通过一个头,第一行已经自动转换成头。
现在,我们不能有两个同名的列,所以2nd 7已经被转换为7.1
要纠正这个问题,你可以尝试:
no_of_columns = 5 Book1 =pd.read_excel("D:\Python\Book1.xlsx",header=None,name=range(no_of_columns))
请注意,您需要先了解列的数量才能执行此操作。
pandas阅读第一行作为标题列。 既然它想避免命名列中的冲突,那么前7
列将保留其原始名称。 第二个7
会产生一个碰撞,所以pandas把它改为7.1
。
设置header=None
。 有关参数的完整说明,请参阅文档 。
您可以按如下方式指定列的names
。
Book1 = pd.read_excel("D:\Python\Book1.xlsx", header=None, names=['col1', 'col2', 'col3', 'col4', 'col5'])
0,1和2是行的索引。 你可以使用这些数字来引用一行。
>>> Book1[0] 1 3 7 2 7.1 <- column names 2 2 3 2 1 <- values in row 0