网页是否被读取? 我怎样才能将其保存到Excel文件?

我想使用Python将网页的文本内容保存到Excel文件。 作为一个新手,下面是目前为止我可以工作,我不知道是否是正确的。

from bs4 import BeautifulSoup from urllib2 import urlopen html = urlopen("http://www.chicagoreader.com").read() soup = BeautifulSoup(html, "lxml") 

它看起来好吗? 将文本内容自动保存到Excel文件的下一步是什么? 我已经安装了xlutils,但不知道如何使用它。

有人可以帮我吗? 谢谢。

为了使用python写入excel文件,你有几个包可供select:

  • xlwt
  • openpyxl
  • xlsxwriter
  • pyexcelerator

所以,这取决于它应该是什么样的Excel文件, xlsxlsx ,你需要格式化,速度问题等

以下是使用xlwt编写(0,0)单元格的网页标题xlwt

 import xlwt from bs4 import BeautifulSoup from urllib2 import urlopen html = urlopen("http://www.chicagoreader.com").read() soup = BeautifulSoup(html, "lxml") workbook = xlwt.Workbook() sheet = workbook.add_sheet('test') sheet.write(0, 0, soup.title.text) workbook.save('output.xls') 

希望有所帮助。