Tag: python

urllib从php链接下载excel文件

我试图从URL使用urllib.urlretrieve (python 2.7)下载xls文件的列表。 我能够获得文件,但是在文件顶部有一个<script>标签,使得它在excel中不可读。 这是我所拥有的: import urllib files= ['a','b', 'c', 'd', 'e', 'f'] url = 'http://www.thewebsite.com/data/dl_xls.php?bid=' for f in files: urllib.urlretrieve(url + f, f + '.xls') 这会在顶部下载一个xls文件: <script>parent.parent.location.href = '../../../../a';</script> ../../../.. <script>parent.parent.location.href = '../../../../a';</script>这使得它在Excel中不可读。 如果我从xls中删除该脚本标记,该文件将在Excel中正确打开。 编辑 – 这是我从pypypy的解决scheme: import urllib files= ['a','b', 'c', 'd', 'e', 'f'] url = 'http://www.thewebsite.com/data/dl_xls.php?bid=' for f in files: input_xls = […]

删除pandas行中的一部分/增加行的一部分? alignment列标题

所以我有一个数据框,我想要的标题目前不排队: In [1]: df = pd.read_excel('example.xlsx') print (df.head(10)) Out [1]: Portfolio Asset Country Quantity Unique Identifier Number of fund B24 B65 B35 B44 456 2 General Type A UNITED KINGDOM 1 123 3 General Type B US 2 789 2 General Type C UNITED KINGDOM 4 4852 4 General Type C UNITED KINGDOM 4 654 […]

python / excel:如何为列A中所有相同的值添加列B的值

Excel图片1 Excel图像2 请看“Excel Image 1”开始。 我正在使用python拉前两列,并将它们存储在自己的单独的数组中。 我想要做的是添加列B的值,如果列中的值是相同的。 例如,如果列A中的值为“0”,则加上-200和400,并获得200,因为“0”在列A的行1和行2中。 如“Excel Image 2”中所示添加之后,将两个Column的新值存储在各自独立的数组中,以便我可以将它们用于以后的计算。 import xlrd excel = '/Users/Bob/Desktop/' wb1 = xlrd.open_workbook(excel + 'assignment.xlsx') sh1 = wb1.sheet_by_index(0) colA,colB = [],[] for a in range(0,sh1.nrows): colA.append(int(sh1.cell(a,0).value)) colB.append(int(sh1.cell(a,1).value)) print(colA) print(colB) for i in colA: if i == 0: add = colB[0] + colB[1] print(add) 我想要一个在B列中添加这些值的代码,而不pipeA列中给出了多less个相同的值或数目。 电stream输出: [0, 0, 1, 2, […]

在Python中将html转换为excel

我试图将以下站点中的表转换为xls表: http://www.dekel.co.il/madad-lazarchan 以下是我从研究中得出的代码: from bs4 import BeautifulSoup import pandas as pd from urllib2 import urlopen import requests import csv url='http://www.dekel.co.il/madad-lazarchan' table = pd.read_html(requests.get(url).text, attrs={"class" : "medadimborder"}) print table</code> 我怎样才能得到它正确显示标题,并输出到CSV或XLS文件? 如果我添加以下内容: table.to_csv('test.csv') 而不是打印行我得到这个错误: 'list' object has no attribute 'to_csv' 提前致谢! 好的根据意见,也许我不应该使用pandas或read_html,因为我想要一个表,而不是一个列表。 我写了下面的代码,但现在打印输出有分隔符,看起来像我失去了标题行。 还不知道如何将其导出到CSV文件。 from bs4 import BeautifulSoup import urllib2 import csv soup = BeautifulSoup(urllib2.urlopen('http://www.dekel.co.il/madad-lazarchan').read(), 'html') data […]

在pythonparsingexcel

所以我现在的问题是读一个.txt文件,并提取具体的数据。 这些数据将被写入一个excel文件中,现在这些行将成为列,反之亦然。 到目前为止,我已经能够读取文件,并创build与列的Excel表,但没有数据传输。 下面是它读取的数据以及写入excel的内容。 [' O/F=7.1800E+00 PERCENT FUEL= 12.2249 EQUIVALENCE RATIO=5.5559E-01 DENSITY=9.5028E-01'] [] [' CHAMBER THROAT EXIT EXIT'] [' PC/P 1.0000 1.7346 1.0083 62.915'] [' P', ' PSIA 1500.0 864.8 1487.7 23.84'] [' T', ' DEG R 5886 5555 5880 3494'] [' H', ' BTU/LB -446.6 -674.1 -450.1 -1819.9'] [' S', ' BTU/(LB)(R) 2.3395 2.3395 […]

excel格式的CSV文件显示不完整

我在Windows 7操作系统上使用Python v2.7。 我的目标是使用Python生成一个包含date,时间等的CSV文件。 问题是,时间的CSV输出是不同的BTW格式和Excel格式。 这里有一些细节。 如果我用txt打开CSV文件,那就好了。 输出如下:2016-03-07,15:16:04.003000,… 但是,当我用Excel打开相同的CSV文件时,输出的时间不完全显示: 您可能会注意到,时间的充分显示实际上就在那里。 但从第2行开始,这是不完整的。 请指教。 谢谢!

用pandas处理Excel文件

我试图读Pandas的Excel文件。 我只想读第2列到第4列。 我试图跳过前9行的阅读。 即使使用skiprows=8, parse_col=["B:D"],存储在df数据看起来与传入的excel文件相同,并且不排除前9行或排除期望的列。 我的语法有什么问题,为什么不是数据库结构存储在dfinput的Excel文件减去9行和几列? 我的传入数据如下: Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,Null,Null,Null,Null,Null Null,Null,Null,Null,String1,String2,Null,Null,Null Null,Phase to Phase Voltage,A – B,210.0,C – A,211.0,B – C,212.0 Null,Circuit/Breaker,Number,Internal Meter Amps,External Meter Amps,Measured Difference,% Difference,Location Identifier,Total Location Amperage,Comments Null,Main Phase A,94.1,96.,2.8,3%,Null,Null,Null Null,Main Phase B,90.1,92.6,2.5,3%,Null,Null,Null Null,Main Phase C,91.9,92.1,0.2,0%,Null,Null,Null Null,Neutral,0.0,0.4,0.4,100%,Null,Null,Null Null,Ground 0.0,0.1,0.1,100%,Null,Null,Null Null,1,10.6,10.2,-0.4,-4%,Null,Null,Null Null,2,10.6,10.3,-0.3,-3%,Null,Null,Null …. 我的代码如下: import pandas as pd […]

从Excel到pandas的Csv中压平表

我试图从Excel中的表中获取数据,并将其放入单行的csv中。 我有从Excel中导入的数据使用pandas的数据框,但现在,我需要将这些数据写入一个csv的单行。 这是可能的,如果是这样的话,如果我正在采取一个50行3列表,并将其展平为1行150列csv表,语法会是什么样子? 我的代码到目前为止如下: import pandas as pd df = pd.read_excel('filelocation.xlsx', sheetname=['pnl1 Data ','pnl2 Data','pnl3 Data','pnl4 Data'], skiprows=8, parse_cols="B:D", keep_default_na='FALSE', na_values=['NULL'], header=3) DataFrame.to_csv("outputFile.csv" ) 另一个问题,我会帮助我理解如何转换这些数据是“有什么办法从特定的行和列中select一个数据”?

如何使用xlwings将值分配给命名范围中的一个单元格?

我也是Python和xlwings的新手。 我需要为指定范围内的每个单元格分步指定一个不同的值。 xw.Range('Named range')。value = [new_cell_values_as_list_of_lists] 这是一个如何将值分配给全范围Named range的示例。 这不是我现在需要的。 我search了xlwings-docs,stackoverflow等,但没有任何想法…方式既不 xw.Range(1,'Named range', 22).value = 'yes' 也不 xw.Range(1, 'Named range', '22').value = 'yes' 不工作。 请帮帮我。

写一个pandasdf到Excel并保存到一个副本

我有一个pandas数据框,我想打开一个包含公式的现有Excel工作簿,将数据框复制到一组特定的列中(可以从列A到列H),并将其另存为具有不同名称的新文件。 这个想法是更新一个现有的模板,使用指定的一组列中的数据框填充它,然后用不同的名称保存一个Excel文件的副本。 任何想法? 我拥有的是: import pandas from openpyxl import load_workbook book = load_workbook('Template.xlsx') writer = pandas.ExcelWriter('Template.xlsx', engine='openpyxl') writer.book = book writer.sheets = dict((ws.title, ws) for ws in book.worksheets) df.to_excel(writer) writer.save()