Tag: 美丽的

每次脚本运行时插入新数据而不覆盖现有数据(Openpyxl:python)

我在使用openpyxl时遇到了麻烦。 我遇到的问题是: 我试图运行一个小时Excel报告使用我通过(BS4)在网上刮过的数据。 我已经将数据分配到一个列表中,可以解压缩以便在PowerShell和Excel中打印,但每次运行脚本时都会覆盖以前的数据。 我想知道如何在每次脚本运行时将数据打印到新行。 问题循环: c = 1 for cell_val in status: sheet1.cell(row=2, column=c).value = cell_val c += 1 print(c)

在Python中使用Web Scraper格式

所以我刮了一个网页收集一些信息,然后希望信息被放在一个Excel表。 我已经完成了这部分。 我正在努力的部分是在列A中写入与列B中的所有数据相关的标题。所以我想在新数据开始的地方打印标题。 这里是html: <div class="result"> <span class="number"><a href="####">#### <span class="d" id="number"> </span> </span></a> <div class="rm"> <span class="detail"><span class="cloud" title="system"></span> information</span> <span class="detail"><span class="marker" title="location"></span> information</span> <br/> <span class="detail"><span class="cog" title="public"></span> information</span> <br/> <span class="detail"><span class="lock" title="name"></span> information</span> <br/> </div> <span class="default">word</span> 所以,当有多个名为“rm”的类时,就会出现问题。 有两个解决scheme我可以想到,但似乎无法得到的代码。 本质上,我需要系统,位置,公共,并在B列中的每一个名称,然后在列A中的数字。然后,一旦下一个“RM”的div来,我希望号码是在新的信息旁边的单元格。 我可以统计每个rm div有多less“细节”,或者我可以打印整个“结果”类。 打印整个课程“结果”的唯一问题是,所有的信息都放到一个单元格中,我需要把它分离出来。 任何帮助表示赞赏! i = br.open(url).read() soup = BeautifulSoup(i) […]

在python中将值写入excel中的一行中的单元格

我一直在试图写入数值生成Excel表格#1的值。 我没有得到任何错误或任何东西,但我也没有在Excel文件中得到任何输出。 还有一个简单的方法来查找行/列是单元格指向? 下面我有我的代码编写的计数从HTML特定的单词,这些值需要放在一个Excel文件。 from xlwt import Workbook import requests from bs4 import BeautifulSoup import re from selenium import webdriver from xlwt import Workbook from collections import Counter driver = webdriver.Firefox() driver.get("fetch dashboard link") login_test = driver.find_element_by_xpath('//*[@id="authContent"]/form/div/p[2]/a') login_test.click() driver.implicitly_wait(30) a = driver.page_source soup = BeautifulSoup(a, "html.parser") wb = Workbook() sheet1 = wb.add_sheet('Automation') sheet1.write_merge(0,2,0,0,'#') sheet1.write_merge(0,0,1,7,'Test Result') […]

Python Web Scraper / Crawler – HTML Tables to Excel Spreadsheet

我试图做一个网站刮板,将从网站拉表,然后将其粘贴到Excel电子表格。 我是Python的EXTREME初学者(一般编码) – 几天前从字面上开始学习。 那么,我该如何制作这个网页抓取工具? 这里是我有的代码: import csv import requests from BeautifulSoup import BeautifulSoup url = 'https://www.techpowerup.com/gpudb/?mobile=0&released%5B%5D=y14_c&released%5B%5D=y11_14&generation=&chipname=&interface=&ushaders=&tmus=&rops=&memsize=&memtype=&buswidth=&slots=&powerplugs=&sort=released&q=' response = requests.get(url) html = response.content soup = BeautifulSoup(html) table = soup.find('table', attrs={'class': 'processors'}) list_of_rows = [] for row in table.findAll('tr')[1:]: list_of_cells = [] for cell in row.findAll('td'): text = cell.text.replace('&nbsp;', '') list_of_cells.append(text) list_of_rows.append(list_of_cells) outfile = open("./GPU.csv", "wb") […]

将结果写入.xls(将2个查询提交到网页,并将不同的结果存储到.xls中)

大家好…我正在使用Python 2.76将查询提交到.aspx网页,并通过BeautifulSoup获取结果,并且希望将它们存储到Excel电子表格中。 import mechanize import re import xlwt from bs4 import BeautifulSoup import urllib2 book = xlwt.Workbook(encoding='utf-8', style_compression = 0) sheet = book.add_sheet('Legi', cell_overwrite_ok = True) for items in ['university student', 'high school student']: url = r'http://legistar.council.nyc.gov/Legislation.aspx' request = mechanize.Request(url) response = mechanize.urlopen(request) forms = mechanize.ParseResponse(response, backwards_compat=False) form = forms[0] response.close() form['ctl00$ContentPlaceHolder1$txtSearch'] = items submit_page […]

在python中为csv添加新行

我试图从http://www.hoopsstats.com/basketball/fantasy/nba/opponentstats/16/12/eff/1-1刮取数据,使用Python 3.5创build一个CSV文件。 我已经想出了如何做,但是当我在Excel中打开文件时,所有的数据都在同一行。 import sys import requests from bs4 import BeautifulSoup import csv r = requests.get('http://www.hoopsstats.com/basketball/fantasy/nba/opponentstats/16/12/eff/1-1') soup = BeautifulSoup(r.text, "html.parser") stats = soup.find_all('table', 'statscontent') pgFile = open ('C:\\Users\\James\\Documents\\testpoop.csv', 'w') for table in soup.find_all('table', 'statscontent','a'): stats = [ stat.text for stat in table.find_all('center') ] team = [team for team in table.find('a')] p = (team,stats) z = […]

美丽的汤:提取天气信息:表 – > Excel文件

我想从本网站的表格中提取数据 天气历史表 我需要的 提取<table class="responsive"> <tbody> <table class="responsive"> \ <tbody> \ <tr>中所有<td>所有内容 使用整个数据从python生成一个Excel文件。 我不需要的 数字旁边的所有单位(即:22°C)(我不想<span>在<td> ) <td class="data-cell alt-cell">33.8 <span class="table-unit">°C</span></td> 在<tbody> \ <tr class="column-heading">和<tr class="row-subheading">排除重复标题 任何人都可以显示和解释我将如何在Excel文件中提取这些数据? HTML代码 <table id="history_table" class="responsive"> <thead> <tr class="column-heading"> <th class="year-cell">2016</th> <th colspan="3">Temperature</th> <th colspan="3">Dew Point</th> <th colspan="3">Humidity</th> <th colspan="3">Speed</th> <th colspan="3">Pressure</th> <th>Precip. Accum.</th> </tr> <tr class="row-subheading"><th>Sep</th> <th class="alt-cell">High</th> <th […]