网页是否被读取? 我怎样才能将其保存到Excel文件?
我想使用Python将网页的文本内容保存到Excel文件。 作为一个新手,下面是目前为止我可以工作,我不知道是否是正确的。
from bs4 import BeautifulSoup from urllib2 import urlopen html = urlopen("http://www.chicagoreader.com").read() soup = BeautifulSoup(html, "lxml")
它看起来好吗? 将文本内容自动保存到Excel文件的下一步是什么? 我已经安装了xlutils,但不知道如何使用它。
有人可以帮我吗? 谢谢。
为了使用python写入excel文件,你有几个包可供select:
- xlwt
- openpyxl
- xlsxwriter
- pyexcelerator
所以,这取决于它应该是什么样的Excel文件, xls
或xlsx
,你需要格式化,速度问题等
以下是使用xlwt
编写(0,0)单元格的网页标题xlwt
:
import xlwt from bs4 import BeautifulSoup from urllib2 import urlopen html = urlopen("http://www.chicagoreader.com").read() soup = BeautifulSoup(html, "lxml") workbook = xlwt.Workbook() sheet = workbook.add_sheet('test') sheet.write(0, 0, soup.title.text) workbook.save('output.xls')
希望有所帮助。