Tag: python

Python:TypeError:必须是str,而不是字节

我试图编写处理HTML网页的代码,并创build一个Excel表格。 有抛出的错误。 请让我知道是否有人可以帮忙。 我跑了很多代码被评论。 我也想包括这一点。 book = xlwt.Workbook(encoding="utf-8") sheet1 = book.add_sheet("Product List") i=0 for row in soup.findAll('li', { "class" : "product-link" }): link = row.a['href'] #print(link) #print(link[23:]) conn = http.client.HTTPSConnection("www.sanjamar.com") conn.request("GET", link[23:]) req = conn.getresponse() #print(req.status, req.reason) data2 = req.read() soup2=BeautifulSoup(data2) Name=soup2.find('title') Name_text = Name.text words = Name_text.split('|') Name = words[0] print(Name) if len(soup2.find_all("div", {"id":"productDescription"})) […]

Python:如何将嵌套列表的字典导出到Excel

我是Python的新手,我很难解决这个问题。 例如,如果我有这样一本字典: my_dict = {(40987, 'A'): [[1, 2, 3], [0, 1, 0], [0, 1, 1]], (11233, 'R'): [[2, 0, 2], [0, 2, 4]], (10716, 'R'): [[1, 1, 1]], (11049, 'S'): [[6, 0, 5], [2, 5, 7]]} 我想要的excel文件的结构是: Code Letter List0 List1 … List_n 40987 A [1, 2, 3] [0, 1, 0] 11233 R [2, 0, […]

使用xlwings创build多个excel书籍 – 计算要求

只是一个(希望)快速的问题一次创build和多个woorkbooks工作。 使用xlwings有没有办法减less计算负担? 如果我想一次创build十个工作簿,那么稍后保存它们的CPU使用率就会相当高。 我的用例是一个生成excel工作簿的web应用程序,因此可以同时创build不less工作簿。 从我所读到的,xlwings的devise必须使用一个excel的实例,所以我假设我的用例将需要一个替代,如openpyxl。

IndexError:索引超出pandas的范围

我是pandas的初学者。 我想从excel文件中提取一列到python数组与pandas.I想运行整个列的循环。 我想打印该列中的第一个数据。这里是我的代码: import pandas as pd xl_workbook = pd.ExcelFile("Summary.xlsx") # Load the excel workbook df = xl_workbook.parse("Sheet1") # Parse the sheet into a dataframe df['transactionqtr'] = pd.to_datetime(df['transactionqtr'],errors ='coerce') df['commencementdate'] = pd.to_datetime(df['commencementdate'],errors ='coerce') df=df.dropna() df['transactionqtr'] = df['transactionqtr'].apply(lambdax:x.date().strftime('%m%d%y')) df['commencementdate'] = df['commencementdate'].apply(lambda x:x.date().strftime('%m%d%y')) arr1 = df['transactionqtr'][1][1] arr2 = df['commencementdate'][1][1] print(arr1) print(arr2) 但它显示IndexError:索引超出这一行的范围: arr1 = df['transactionqtr'][1][1] arr2 = […]

使用Python编写和修改现有的工作簿

我是Python新手,正在开发一个项目,我可以使用一些帮助。 所以我试图修改一个现有的Excel工作簿,以比较股票数据。 幸运的是,有一个在线程序检索到了我需要的所有数据,并且我已经成功地将数据提取出来,并将数据写入到一个新的excel文件中。 但是,目标是拉取数据并将其放入现有的excel文件中。 此外,我需要覆盖现有文件中的单元格值。 我相信xlwings能够做到这一点,我认为我的代码是在正确的轨道上,但我遇到了一个意想不到的错误。 我得到的错误是: com_error: (-2147023174, 'The RPC server is unavailable.', None, None) 我想知道是否有人知道为什么这个错误出现? 另外,有谁知道如何解决它? 它可以修复吗? 我的代码错了吗? 任何帮助或指导表示赞赏。 谢谢。 import good_morning as gm import pandas as pd import xlwings as xw #import income statement, balance sheet, and cash flow of AAPL fd = gm.FinancialsDownloader() fd_frames = fd.download('AAPL') #Creates a DataFrame for only […]

从txt文件中获取数据,parsing并放入CSV

我一直在网上寻找一个解决我的确切问题,但所有的答案都过时了。 我有一个文本文件包含这种forms的数据: 第一个名字:xxx 中间名:xxx 姓:xxx 生日:xxx 高度:xxx 重量:xxx 地址:xxx CITY,STATE ZIP:xxx 文件中有多个条目。 我需要从“xxx”中获取数据,基本上每个“:”后的所有数据都放在一行中,每个“xxx”用逗号隔开。 这是我可以使用它作为一个CSV文件。 我想把这个信息放入Excel工作表中。 所以我希望它看起来像这样: firstname,middlename,lastname,birthday,height,weight,address,citystatezip 这就是我所拥有的,我不知道从哪里走。 with open('info.txt') as file: for rec in file: print rec.split(':')[1] 这段代码只是假设在“:”后面打印每个东西。 我不能真正把它工作,也不知道我将如何把它放在我想要的格式。

TypeError:“set”对象不支持在Excel中build立索引

有人能帮我吗? 我有这个错误。 我想循环并将所有的数据从wordnet插入到excel的不同列中。 它将首先阅读有一列的Excel文档。 然后,创build其他excel,并为每个单词生成一行和不同列的同义词。 此代码在一列中生成同义词: import nltk import xlrd import csv import xlwt import xlsxwriter from nltk.corpus import stopwords from nltk.tokenize import word_tokenize from nltk.corpus import wordnet workbook = xlrd.open_workbook('C:\\Users\\runeza\Desktop\database.xlsx') sheet_names = workbook.sheet_names() sheet = workbook.sheet_by_name(sheet_names[0]) wb = xlwt.Workbook() ws = wb.add_sheet("test") for col_idx in range(sheet.ncols): for row_idx in range(sheet.nrows): cell = sheet.cell(row_idx, col_idx).value […]

从xlwings调用Pycharm时的断点

从xlwings调用python代码时,我无法获得断点。 testme.py: import xlwings as xw def add(n): result = [] while len(result) < n: result.append(1+4) return result def xl_add(): sht = xw.Book.caller().sheets[0] n = sht.range('B1').options(numbers=int).value seq = add(n) sht.range('C1').expand('vertical').clear_contents() sht.range('C1').options(transpose=True).value = seq if __name__ == "__main__": xw.serve() 我用这个VBA代码在同一个目录下保存了一张XL表格: Sub CallTestMe() RunPython ("import testme; testme.xl_add()") End Sub 在xlwings.bas我更改设置为: PYTHON_WIN = "D:\Anaconda3\python.exe" UDF_DEBUG_SERVER = True 然后我启动了pycharm,并在add(n)中设置了一个断点,并启动了debugging器。 […]

Python XLSXwriter错误。 工作簿不正确closures

我正在尝试使用模块xlsxwriter从列表中生成一个excel工作表,但是我不断收到工作簿不会closures的错误。 这里是错误信息和代码。 该列表正确生成数据。 码: import csv import xlsxwriter f = open('alerts2.csv') csv_f = csv.reader(f) li1 = [] header = next(csv_f) for row in csv_f: # li1.append(row[5]) # li1.append(row[0]) severity = int(row[0]) #Has The the integer value from 10 – 40 if severity != 40: continue Status = str(row[1]) PolicyName = str(row[2]) PolicyBlockName = str(row[3]) PolicyRuleName […]

使用Python在文件夹结构中的文档中查找关键字

我想知道是否有人知道如何在文档中查找关键字,然后将这些文字导出到Excel文档中。 例如,我在文件夹A>文件夹B中有一个名为“test”的文档。我想要进入该文件夹,find名为“test”的文档,打开该文件,find关键字“test”,然后导出“testing“到一个excel文件。 我问的原因是有成千上万的文件夹需要这样做。 我已经看了其他解决scheme,他们build议pdfminer,但我不知道如何跨多个文件夹/子文件夹运行,并将关键词导出到Excel文档。 这是我迄今为止。 它能够将PDF转换为文本,然后从文本中查找关键字。 不知道我怎么能够将这些数据导出到Excel文件/列。 谢谢 from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter from pdfminer.converter import TextConverter from pdfminer.layout import LAParams from pdfminer.pdfpage import PDFPage from cStringIO import StringIO import xlsxwriter # Create a workbook and add a worksheet. workbook = xlsxwriter.Workbook('Stafford_Capital.xlsx') worksheet = workbook.add_worksheet() def convert_pdf_to_txt(path): rsrcmgr = PDFResourceManager() retstr = StringIO() codec = […]