带有超链接的pandasread_excel

我有一个Excel电子表格,正在读入一个Pandas DataFrame:

df = pd.read_excel("file.xls") 

但是,电子表格的其中一列包含与其关联的超链接的文本。 如何访问Pandas中的底层超链接?

这可以用openpyxl来完成,我不确定它可能与pandas有什么关系。 以下是我如何做到的:

 import openpxyl wb = openpyxl.load_workbook('yourfile.xlsm') ws = wb.get_sheet_by_name('Sheet1') print(ws.cell(row=2, column=1).hyperlink.target) 

您也可以使用iPython,并设置一个等于超链接对象的variables:

t = ws.cell(row=2, column=1).hyperlink

然后做t. 然后按Tab键查看所有可用的选项或从对象访问的选项。

你不能在pandas那里做到这一点。 你可以尝试用其他库来处理excel文件 。

作为slaw评论它不抢超链接,但只有文本

这里text.xlsx包含第9列的链接

 workbook = load_workbook('test.xlsx') worksheet = workbook.active column_indices = [9] for row in range(2,worksheet.max_row+1): for col in column_indices: filelocation = worksheet.cell(column=col, row=row ) #this is hyperlink text = worksheet.cell(column=col+1, row=row) # thi is your text worksheet.cell(column=col+1,row=row).value = '=HYPERLINK("'+filelocation.value+'","'+text.value+'")' workbook.save('test.xlsx')