Tag: urllib2

无法使用urllib2下载整个文件

您好我试图从这个url( http://www.sicom.gov.co/precios/controller?accion=ExportToExcel )下载一个Excel文件,然后我需要使用xlrdparsing它。 问题是,当我把Url放在浏览器上的时候,我得到的是一个大概2MB的excel文件,但是当我使用urllib2,http2lib甚至是从命令行curl下载文件的时候,我只能得到一个4k的文件,显然parsing不完整文件惨败。 奇怪的是,xlrd似乎能够从下载的文件中读取正确的表名,所以我猜这个文件是正确的,但显然是不完整的。 这里是我想要实现的一些示例代码 import urllib2 from xlrd import open_workbook excel_url = 'http://www.sicom.gov.co/precios/controller?accion=ExportToExcel' result = urllib2.urlopen(excel_url) wb = open_workbook(file_contents=result.read()) response = "" for s in wb.sheets(): response += 'Sheet:' + s.name + '<br>' for row in range(s.nrows): values = [] for col in range(s.ncols): value = s.cell(row, col).value if (value): values.append(str(value) + " […]

读取使用urllib2检索到的Excel对象

我正在使用urllib2获取一个Excel文件并保存到下面的响应中。 我想能够使用xlrd或类似的处理这个Excel文件。 我在下面列出了一些信息,让我知道如果我可以提供更多的信息。 我怎样才能将响应对象转换成我可以玩的对象? response = <addinfourl at 199999998 whose fp = <socket._fileobject object at 0x100001010>> response.read() prints: '\xd0\xcf\x11\xe0…' Headers: Content-Type: application/vnd.ms-excel Transfer-Encoding: chunked