如何使用xpath从html中提取数据
我试图从Google电子表格的Google购物中 提取产品价格 :
=IMPORTXML("https://www.google.com.br/?source=pshome-c-0-3&sa=X&ved=0ahUKEwjfguD5xaHKAhXMiZAKHWjuBi8Q7j8IEA#tbm=shop&q=Samsung+Galaxy+S6&spd=0";"/div[@class='product-results']/div[@class='psli'][2]/div[@class='pslicont']/div[@class='pslmain']/div[@class='pslline'][1]/div[@class='_tyb shop__secondary']/span[@class='price']/b")
我的xpath查询是:
/div[@class='product-results']/div[@class='psli'][2]/div[@class='pslicont']/div[@class='pslmain']/div[@class='pslline'][1]/div[@class='_tyb shop__secondary']/span[@class='price']/b
但是我没有结果。
怎么了?
Google购物的HTML
因为谷歌在实际上不返回HTML。 查看页面的源代码
-
view-source:https://www.google.com.br/?source=pshome-c-0-3&sa=X&ved=0ahUKEwjfguD5xaHKAhXMiZAKHWjuBi8Q7j8IEA#tbm=shop&q=Samsung+Galaxy+S6&spd=0
尝试使用User Agent,同时从Google获取HTML。 这是我前几天遇到的问题,并通过模仿用户代理成为Chrome浏览器来解决问题。 你可以find不同的方式来模仿在谷歌自己的用户代理(没有双关语意图)。