Tag: python

用numpy.genfromtxt()读取CSV文件 – 分隔符作为行名称的一部分

我已经从http://www.gapminder.org/data以Excel / CSV格式下载了“第一婚姻年龄(女性)”数据集。 数据集具有标题的第一行,第一列包含国家的名称。 要阅读这些数据,我使用下面的代码。 import numpy as np source=open("D:\FirstMarriage.csv") data = np.genfromtxt(source, dtype=None, delimiter=",", skip_header=1) print data 执行此代码(在Spyder IDE中)后,我收到此错误: ValueError: Some errors were detected ! Line #37 (got 118 columns instead of 117) Line #38 (got 118 columns instead of 117) Line #72 (got 118 columns instead of 117) Line #87 (got 118 columns […]

在Pandas和Excel中部分重复的条件格式

我有以下csv数据名为reviews.csv : Movie,Reviewer,Sentence,Tag,Sentiment,Text, Jaws,John,s1,Plot,Positive,The plot was great, Jaws,Mary,s1,Plot,Positive,The plot was great, Jaws,John,s2,Acting,Positive,The acting was OK, Jaws,Mary,s2,Acting,Neutral,The acting was OK, Jaws,John,s3,Scene,Positive,The visuals blew me away, Jaws,Mary,s3,Effects,Positive,The visuals blew me away, Vertigo,John,s1,Scene,Negative,The scenes were terrible, Vertigo,Mary,s1,Acting,Negative,The scenes were terrible, Vertigo,John,s2,Plot,Negative,The actors couldn't make the story believable, Vertigo,Mary,s2,Acting,Positive,The actors couldn't make the story believable, Vertigo,John,s3,Effects,Negative,The effects were awful, […]

合并大pandas列(一对多)

我是新的Python大pandas,我想通过一个共同的ID结合几个Excel工作表。 此外,这是一个一对多的关系。 这里是input: DF1 <b>ID Name</b><br/> 3763058 Andi<br/> 3763077 Mark 和 DF2: <b>ID Tag</b><br/> 3763058 item1 <br/> 3763058 item2<br/> 3763058 item3<br/> 3763077 item_4<br/> 3763077 item_5<br/> 3763077 item_6 现在,我想将两个pandasdataframedf1和df2合并到以下输出中(列标记合并在每个ID的单个列中): <b>ID Name Tag</b><br/> 3763058 Andi item1, item2, item3<br/> 3763077 Mark item_4, item_5, item_6<br/> 有人可以帮我吗? 干杯,安迪

将新行添加到python中现有的excel列

我想每周添加新的logging到这个现有的文件,而不是创build一个新的。 例如,下一步,我想在2016年6月13日添加logging 兰迪 – >(13,23,13) 肖 – >(13,15,13) 以及未来两个月的许多这样的条目。 我怎么做? 我是初学者,所以无法用语法来expression。 我只能做到这一点 import xlrd #Opening the excel file file_location= "C:/Users/agodgh1a/Desktop/Apurva/EPSON.xlsx" workbook= xlrd.open_workbook(file_location) sheet=workbook.sheet_by_index(0) 谢谢!

python中的Pyexcel中迭代表单

我想遍历Excel的所有非空表,以获得标题。 我必须使用PyExcel。以下是我的代码: import pyexcel as pe book = pe.get_book(file_name="Mydata.xlsx") j=0 print(j) for j in range(100): for item in book.sheet_by_index(j): sheet = pe.get_sheet(file_name="Mydata.xlsx") sheetheaders= sheet.row_at(0) header_list = [i for i in sheetheaders if i != '' ] print(header_list) j=j+1 任何人都可以告诉我如何迭代它,而不会出现以下错误? Traceback (most recent call last): line 11, in <module> for sheet in book[i]: TypeError: 'NoneType' object […]

xlwings:使单元格大胆

我已经看到文体要求将在xlwings中实施。 是否有一个解决方法,使一个单元格的内容大胆?

用ctrl + q发送excel文件

我有一个Excel文件,我需要按CTRL + Q使一个VBA代码(macros)运行。 有没有办法做到这一点与Python? 有点像: with open (my_file,"wb") "press ctrl+q" close file 谢谢!

从xlsx读取数据到Pandas数据框

情景:我把这个小小的Frankenstein代码(来自SO用户的一些很棒的帮助)放在一起,从excel文件中获取数据并放入pandas数据框中。 我正在尝试做什么:我试图从可能包含一个或多个数据工作表的文件中获取数据。 之后,我打算相应地组织数据框。 例如: date1 identifier 1 bid ask date1 identifier 2 bid ask date1 identifier 3 bid ask date2 identifier 1 bid ask date2 identifier 3 bid ask date3 identifier 4 bid ask date3 identifier 5 bid ask Obs1:每个文件可以具有“Bid”,“Ask”或两者的值,每个文件都在单独的工作表中。 Obs2:标识符和date在文件间可能相同也可能不同。 我到目前为止所做的:我现在的代码读取文件和每个工作表。 如果符合条件,则附加到特定的dataframe。 然后修复列标题。 问题:当我的代码运行时,出于某种原因,会产生两个空的数据框。 问题:如何解释不同的工作表并将相应的值(以上结构)输出到数据框? 当前代码: import pandas as pd import numpy as np […]

使用xlrd跟踪错误的文件名

我正在使用xlrd打开一个“.xlsx”文件,并从中读取数据进行修改。 如果文件名存在,一切正常。 但如果文件不存在,我会得到一个回溯。 我正在使用的代码是(只是相关的部分): from xlrd import open_workbook, XLRDError from xlwt import * filename = "./resources/tags_meters.xlsx" bad_filename = "./resources/meters.txt" # Use this to test bad filenames filename = bad_filename 还有我使用函数来检查文件是否可以打开: def test_book(filename): try: open_workbook(filename) except XLRDError as e: print "error is" + e.message return False else: return True if test_book(filename): print "Book Ok … Opening […]

在Openpyxl中使用嵌套字典创build一个列表

我想遍历Excel工作表中的所有行,并将每行(从第2行开始)的值存储在1个大表中的各个字典中。 从A列到D列的Excel中有一个简单的项目列表: Fruit: Quantity: Color: Cost Apple 5 Red 0.6 Banana 6 Yellow 0.4 Orange 4 Orange 0.3 Kiwi 2 Green 0.1 我想要第一个结果看起来像: [{'Fruit': 'Apple', 'Quantity': 5, 'Color': 'Red', 'Cost': 0.6}] 以下是我的代码现在的样子: import openpyxl wb = openpyxl.load_workbook('fruit.xlsx') sheet = wb.get_sheet_by_name('Sheet1') for row in range(2, sheet.max_row + 1): fruit = sheet['A' + str(row)].value quantity = sheet['B' […]