Tag: 网页抓取

使用VBA从站点刮取innerHTML

我试图声明一个节点的数组(这不是一个问题),然后在数组的每个元素中刮去两个子节点的innerHTML – 以SE为例(使用IE对象方法),假设I试图在主页上提取标题和问题摘要,则有一个节点数组(类名为“ question-summary ”)。 然后有两个子节点(瓦片类名称:“ 问题超链接 ”和摘录 – 类名称:“ 摘录 ”)我使用的代码如下: Sub Scraper() Dim ie As Object Dim doc As Object, oQuestionShells As Object, oQuestionTitle As Object, oQuestion As Object, oElement As Object Dim QuestionShell As String, QuestionTitle As String, Question As String, sURL As String Set ie = CreateObject("internetexplorer.application") sURL = "https://stackoverflow.com/questions/tagged/excel-formula" QuestionShell […]

使用Excel VBA从网站刮文本?

我很早就使用Excel作为网页刮板,但是我发现这个非常有趣的文章解释了如何使用Excel VBA从网站刮取某些标签。 我有下面的代码工作正常,但它只是从它find的第一个<p>标签的内容: Sub get_title_header() Dim wb As Object Dim doc As Object Dim sURL As String Dim lastrow As Long lastrow = Sheet1.Cells(Rows.Count, "A").End(xlUp).Row For i = 2 To lastrow Set wb = CreateObject("internetExplorer.Application") sURL = Cells(i, 1) wb.navigate sURL wb.Visible = True While wb.Busy DoEvents Wend 'HTML document Set doc = wb.document Cells(i, […]

尝试在Excel中使用VBA从网页中提取一个值

我一直试图find信息几天,但所有我发现的例子只是一小段代码,我需要它=) 我想要做的是从主页中提取一个值,并将其放入Excel中的一个单元格(然后从另一个页面上的另一个值在同一个网站上,并放入下一个单元格等等) 该页面是一个瑞典股票交易页面,我用作testing页面的页面是“投资者B”的股票( https://www.avanza.se/aktier/om-aktien.html/5247 /投资者-b ) 而我感兴趣的价值就是所谓的“Senaste”(这是围绕它的页面信息) <li> <span class="XSText">Senast<br/></span> <span class="lastPrice SText bold"><span class="pushBox roundCorners3" title="Senast uppdaterad: 17:29:59">248,60</span></span> </li> 这是我以后的价值248,60! 我有一些编程经验,但不是VBA脚本,在阅读了一些论坛post(大部分是这里)之后,我一直在尝试一些例子,但是没有得到任何工作。 由于我对VBA基本很熟,所以我可能会弄错结构,所以请对我基本耐心,这是我的testing,但是我得到了“运行时错误429”的ActiveX组件不能创build对象 我可能完全走错了路 Private Sub CommandButton1_Click() Dim ie As Variant Set ie = CreateObject("InternetExplorer") ie.navigate "https://www.avanza.se/aktier/om-aktien.html/5247/investor-b" ie.Visible = True Do DoEvents Loop Until ie.readyState = READYSTATE_COMPLETE Application.Wait (Now() + TimeValue("00:00:016")) ' For internal page […]