Tag: python

读取在pandas中保存为CSV文件的Excel数据集

有一个非常类似的问题,我要在这里张贴: 使用pandas在Python中读取Excel文件 除了当我试图使用在这里张贴的解决scheme,我反驳 AttributeError:'DataFrame'对象没有属性'read' 我想要做的就是把这张excel表格转换成pandas格式,这样我就可以对表格的一些主题进行数据分析了。 我对这个超级新,所以任何信息,build议,反馈或任何人可以折腾我的方式将不胜感激。 下面是我的代码: import pandas file = pandas.read_csv('FILENAME.csv', 'rb') # reads specified file name from my computer in Pandas format print file.read() 顺便说一句,我也尝试运行相同的查询与文件= pandas.read_excel('FILENAME.csv','rb')返回相同的错误。 最后,当我尝试将文件重新保存为.xlsx时,我无法打开文档。 干杯!

用python编辑excel表格单元格

我想通过python编辑excel表格单元格。 编辑我使用以下代码: from xlrd import open_workbook from xlutils.copy import copy xl_file = r'D:\path\excel.xls' rb = open_workbook(xl_file) wb = copy(rb) sheet = wb.get_sheet(0) sheet.write(0,2,'New_Data_For_Cell') wb.save(xl_file) 与此代码单元格值更新成功,但整个Excel表单背景颜色格式更改为默认值。 我想保持所有的颜色和格式更新单元格的值。

Pythondate时间和Excel之间的date转换差异

我试图parsing从Python中的Excel文件中收到的数据。 为此,我正在使用xlrd库。 我在Excel中有一个单元格,其值是5/16/2016 12:15,而我在Python中以42506.6493的格式收到它。 我知道Excel将date保存为自1/1/1900以来的天数。 所以在Python中,我试图添加这个天数(现在没有表示时间的分数的几天)来获得相同的date,使用下面的代码: orgDate = datetime.datetime(1900,1,1,0,0,0,0) xlVal = 42506.6493 newDate = orgDate + datetime.timedelta(days=int(xlVal)) 但是,当我读到newDate的值时,我发现它是datetime.datetime(2016, 5, 18, 0, 0) newDate datetime.datetime(2016, 5, 18, 0, 0)而应该是5月16日不是18.任何人都知道如何处理这个?

Excel仪表板是否可以自动更新?

我需要创build一个基于Excel表的仪表板,我知道Excel有创build仪表板的function。 我已经看过如何做,并已经完成了我的研究的教程,但在我的情况下,仪表板将基于Excel表格每2分钟更新一个python脚本。 我的问题是,仪表板是否自动显示,如果表中的值已被修改,或是否需要重新打开,重新加载等。

使用Python从OneDrive下载Excel文件会导致文件损坏

我正试图从OneDrive位置下载一个Excel文件。 我的代码工作正常获取文件,但文件已损坏(我收到一条错误消息): import urllib2 data = urllib2.urlopen("enter url here") with open('C:\\Video.xlsx', 'wb') as output: output.write(data.read()) output.close() print "done" 我使用访客访问Excel文件,以便我不必使用身份validation。 由此产生的文件似乎是15KB,原来是22KB。

在excel文件中存储python程序输出的数据

ענת מאירה 0546515015 2016-07-25 בוטוקס ועיבוי שפתיים. מחמוד אבו חב 0505178463 2016-07-25 מתעניין בעורך דין לכל מטרה. אנעאם אבו חב 0542969636 2016-07-25 מתעניין בעורך דין לכל מטרה. 这是一个从python报废得到的输出我想把它存储到excel / csv文件中,比如每行包含4列 例如 +——————————————————-+ | col 1 | col 2 | col 3 | col 4 | |בוטוקס ועיבוי שפתיים|0546515015|2016-07-25"|ענת מאירה| +——————————————————+ 我怎么能实现它..? 请帮助…在此先感谢:)

迭代先前过滤的行openpyxl

我有一个Python代码写入加载Excel工作簿,遍历指定列中的所有行,将行保存在字典中,并将该字典写入.txt文件。 引用的vb脚本会在openpyxl执行之前打开工作簿,并将其过滤为只显示一些数据。 唯一的问题是,当openpyxl遍历工作簿时,它会logging每个值而不是过滤的数据。 例如,如果原始电子表格是: ABC 1 xxx 2 xyx 3 xxx 我筛选列B只显示包含“x”的行,然后保存该工作簿。 我想要openpyxl只遍历行1和3。 这里是我的代码: from openpyxl import load_workbook from openpyxl import workbook import os #sort using vba script os.system(r"C:\script.vbs") #load workbook path = 'C:/public/temp/workbook.xlsm' wb = load_workbook(filename = path) ws=wb.get_sheet_by_name('Sheet3') #make empty lists proj_name = [] proj_num = [] proj_status = [] #iterate through rows […]

使用pandas生成excel xlsx文件时的索引0

df1=pd.read_csv('out.csv') df2=pd.read_excel('somefile.xls') #put columns from df1 to df2 df2['eer']=df1['eer'] df2['wer']=df1['wer'] df2['zer']=df1['zer'] df2['qer']=df1['qer'] df2['der']=df1['der'] #make a new file with somefile.xls columns + the ones above newfile = input("Enter a name for the combined file: ") writer = pd.ExcelWriter(newfile) df2.to_excel(writer) writer.save() 我在我的程序的末尾使用pythonpandas模块的这部分代码,所以每当我生成所需的所有列的新文件,列A有一些索引从0到最后一行,而不是'名字“这是什么somefile的列A是。 'Name'现在是B列 喜欢这个 0 1 2 3 4 5 6 7 8 9

不同计算机上的脚本执行时间(python 3.5,miniconda)

我遇到了以下问题:在计算机(编号2)上,脚本执行时间明显大于另一台计算机(计算机1)。 计算机1 – i3 – 4170 CPU @ 3.7 GHz(4核心),4 GB RAM(执行时间9.5分钟) 电脑2 – i7 – 3.07GHz(8核心),8GB内存(执行时间15-17分钟) 我使用Python来处理Excel文件。 我为这三个库导入: xlrd , xlsxwriter , win32com 为什么执行时间不同? 我该如何解决?

openpyxl趋势线和R平方值

我试图添加“线性”趋势线到我的Excel图表,并显示R平方值使用openpyxl,但我找不到任何示例。 下面是生成图像上显示的图表的python代码,没有趋势线和R平方公式图表图像 。 谢谢! from openpyxl import Workbook, load_workbook from openpyxl.chart import ( ScatterChart, Reference, Series, ) from openpyxl.chart.trendline import Trendline wb = load_workbook(r"path to load blank workbook\data.xlsx") ws = wb.active rows = [ ['Size', 'Batch 1'], [3, 40], [4, 50], [2, 40], [5, 30], [6, 25], [7, 20], ] for row in rows: ws.append(row) […]