在Python中使用Web Scraper格式

所以我刮了一个网页收集一些信息，然后希望信息被放在一个Excel表。我已经完成了这部分。我正在努力的部分是在列A中写入与列B中的所有数据相关的标题。所以我想在新数据开始的地方打印标题。这里是html：

<div class="result"> <span class="number"><a href="####">#### <span class="d" id="number"> </span> </span></a> <div class="rm"> <span class="detail"><span class="cloud" title="system"></span> information</span> <span class="detail"><span class="marker" title="location"></span> information</span> <br/> <span class="detail"><span class="cog" title="public"></span> information</span> <br/> <span class="detail"><span class="lock" title="name"></span> information</span> <br/> </div> <span class="default">word</span>

所以，当有多个名为“rm”的类时，就会出现问题。有两个解决scheme我可以想到，但似乎无法得到的代码。本质上，我需要系统，位置，公共，并在B列中的每一个名称，然后在列A中的数字。然后，一旦下一个“RM”的div来，我希望号码是在新的信息旁边的单元格。我可以统计每个rm div有多less“细节”，或者我可以打印整个“结果”类。打印整个课程“结果”的唯一问题是，所有的信息都放到一个单元格中，我需要把它分离出来。任何帮助表示赞赏！

 i = br.open(url).read() soup = BeautifulSoup(i) div = soup.findAll('span', attrs={"class":"detail"}) idiv = soup.findAll('span', attrs={"class":"number"}) for val in idiv: worksheet.write(counter,0,val.text) counter += 1 for val2 in div: worksheet.write(row,1,val2.text) row += 1

所以这个代码的结果就是这个数字在列A中逐个列出，并且信息就在我想要的地方。问题是我希望数字在信息开始的地方。

在Python中使用Web Scraper格式

Python Web Scraper / Crawler – HTML Tables to Excel Spreadsheet

在python中将值写入excel中的一行中的单元格

美丽的汤：提取天气信息：表 – > Excel文件

每次脚本运行时插入新数据而不覆盖现有数据（Openpyxl：python）

在python中为csv添加新行

将结果写入.xls（将2个查询提交到网页，并将不同的结果存储到.xls中）