Tag: python

Python：TypeError：必须是str，而不是字节: 我试图编写处理HTML网页的代码，并创build一个Excel表格。有抛出的错误。请让我知道是否有人可以帮忙。我跑了很多代码被评论。我也想包括这一点。 book = xlwt.Workbook(encoding="utf-8") sheet1 = book.add_sheet("Product List") i=0 for row in soup.findAll('li', { "class" : "product-link" }): link = row.a['href'] #print(link) #print(link[23:]) conn = http.client.HTTPSConnection("www.sanjamar.com") conn.request("GET", link[23:]) req = conn.getresponse() #print(req.status, req.reason) data2 = req.read() soup2=BeautifulSoup(data2) Name=soup2.find('title') Name_text = Name.text words = Name_text.split('|') Name = words[0] print(Name) if len(soup2.find_all("div", {"id":"productDescription"})) […]

Python：如何将嵌套列表的字典导出到Excel: 我是Python的新手，我很难解决这个问题。例如，如果我有这样一本字典： my_dict = {(40987, 'A'): [[1, 2, 3], [0, 1, 0], [0, 1, 1]], (11233, 'R'): [[2, 0, 2], [0, 2, 4]], (10716, 'R'): [[1, 1, 1]], (11049, 'S'): [[6, 0, 5], [2, 5, 7]]} 我想要的excel文件的结构是： Code Letter List0 List1 … List_n 40987 A [1, 2, 3] [0, 1, 0] 11233 R [2, 0, […]

使用xlwings创build多个excel书籍 – 计算要求: 只是一个（希望）快速的问题一次创build和多个woorkbooks工作。使用xlwings有没有办法减less计算负担？如果我想一次创build十个工作簿，那么稍后保存它们的CPU使用率就会相当高。我的用例是一个生成excel工作簿的web应用程序，因此可以同时创build不less工作簿。从我所读到的，xlwings的devise必须使用一个excel的实例，所以我假设我的用例将需要一个替代，如openpyxl。

IndexError：索引超出pandas的范围: 我是pandas的初学者。我想从excel文件中提取一列到python数组与pandas.I想运行整个列的循环。我想打印该列中的第一个数据。这里是我的代码： import pandas as pd xl_workbook = pd.ExcelFile("Summary.xlsx") # Load the excel workbook df = xl_workbook.parse("Sheet1") # Parse the sheet into a dataframe df['transactionqtr'] = pd.to_datetime(df['transactionqtr'],errors ='coerce') df['commencementdate'] = pd.to_datetime(df['commencementdate'],errors ='coerce') df=df.dropna() df['transactionqtr'] = df['transactionqtr'].apply(lambdax:x.date().strftime('%m%d%y')) df['commencementdate'] = df['commencementdate'].apply(lambda x:x.date().strftime('%m%d%y')) arr1 = df['transactionqtr'][1][1] arr2 = df['commencementdate'][1][1] print(arr1) print(arr2) 但它显示IndexError：索引超出这一行的范围： arr1 = df['transactionqtr'][1][1] arr2 = […]

使用Python编写和修改现有的工作簿: 我是Python新手，正在开发一个项目，我可以使用一些帮助。所以我试图修改一个现有的Excel工作簿，以比较股票数据。幸运的是，有一个在线程序检索到了我需要的所有数据，并且我已经成功地将数据提取出来，并将数据写入到一个新的excel文件中。但是，目标是拉取数据并将其放入现有的excel文件中。此外，我需要覆盖现有文件中的单元格值。我相信xlwings能够做到这一点，我认为我的代码是在正确的轨道上，但我遇到了一个意想不到的错误。我得到的错误是： com_error: (-2147023174, 'The RPC server is unavailable.', None, None) 我想知道是否有人知道为什么这个错误出现？另外，有谁知道如何解决它？它可以修复吗？我的代码错了吗？任何帮助或指导表示赞赏。谢谢。 import good_morning as gm import pandas as pd import xlwings as xw #import income statement, balance sheet, and cash flow of AAPL fd = gm.FinancialsDownloader() fd_frames = fd.download('AAPL') #Creates a DataFrame for only […]

从txt文件中获取数据，parsing并放入CSV: 我一直在网上寻找一个解决我的确切问题，但所有的答案都过时了。我有一个文本文件包含这种forms的数据：第一个名字：xxx 中间名：xxx 姓：xxx 生日：xxx 高度：xxx 重量：xxx 地址：xxx CITY，STATE ZIP：xxx 文件中有多个条目。我需要从“xxx”中获取数据，基本上每个“：”后的所有数据都放在一行中，每个“xxx”用逗号隔开。这是我可以使用它作为一个CSV文件。我想把这个信息放入Excel工作表中。所以我希望它看起来像这样： firstname,middlename,lastname,birthday,height,weight,address,citystatezip 这就是我所拥有的，我不知道从哪里走。 with open('info.txt') as file: for rec in file: print rec.split(':')[1] 这段代码只是假设在“：”后面打印每个东西。我不能真正把它工作，也不知道我将如何把它放在我想要的格式。

TypeError：“set”对象不支持在Excel中build立索引: 有人能帮我吗？我有这个错误。我想循环并将所有的数据从wordnet插入到excel的不同列中。它将首先阅读有一列的Excel文档。然后，创build其他excel，并为每个单词生成一行和不同列的同义词。此代码在一列中生成同义词： import nltk import xlrd import csv import xlwt import xlsxwriter from nltk.corpus import stopwords from nltk.tokenize import word_tokenize from nltk.corpus import wordnet workbook = xlrd.open_workbook('C:\\Users\\runeza\Desktop\database.xlsx') sheet_names = workbook.sheet_names() sheet = workbook.sheet_by_name(sheet_names[0]) wb = xlwt.Workbook() ws = wb.add_sheet("test") for col_idx in range(sheet.ncols): for row_idx in range(sheet.nrows): cell = sheet.cell(row_idx, col_idx).value […]

从xlwings调用Pycharm时的断点: 从xlwings调用python代码时，我无法获得断点。 testme.py： import xlwings as xw def add(n): result = [] while len(result) < n: result.append(1+4) return result def xl_add(): sht = xw.Book.caller().sheets[0] n = sht.range('B1').options(numbers=int).value seq = add(n) sht.range('C1').expand('vertical').clear_contents() sht.range('C1').options(transpose=True).value = seq if __name__ == "__main__": xw.serve() 我用这个VBA代码在同一个目录下保存了一张XL表格： Sub CallTestMe() RunPython ("import testme; testme.xl_add()") End Sub 在xlwings.bas我更改设置为： PYTHON_WIN = "D:\Anaconda3\python.exe" UDF_DEBUG_SERVER = True 然后我启动了pycharm，并在add（n）中设置了一个断点，并启动了debugging器。 […]

Python XLSXwriter错误。工作簿不正确closures: 我正在尝试使用模块xlsxwriter从列表中生成一个excel工作表，但是我不断收到工作簿不会closures的错误。这里是错误信息和代码。该列表正确生成数据。码： import csv import xlsxwriter f = open('alerts2.csv') csv_f = csv.reader(f) li1 = [] header = next(csv_f) for row in csv_f: # li1.append(row[5]) # li1.append(row[0]) severity = int(row[0]) #Has The the integer value from 10 – 40 if severity != 40: continue Status = str(row[1]) PolicyName = str(row[2]) PolicyBlockName = str(row[3]) PolicyRuleName […]

使用Python在文件夹结构中的文档中查找关键字: 我想知道是否有人知道如何在文档中查找关键字，然后将这些文字导出到Excel文档中。例如，我在文件夹A>文件夹B中有一个名为“test”的文档。我想要进入该文件夹，find名为“test”的文档，打开该文件，find关键字“test”，然后导出“testing“到一个excel文件。我问的原因是有成千上万的文件夹需要这样做。我已经看了其他解决scheme，他们build议pdfminer，但我不知道如何跨多个文件夹/子文件夹运行，并将关键词导出到Excel文档。这是我迄今为止。它能够将PDF转换为文本，然后从文本中查找关键字。不知道我怎么能够将这些数据导出到Excel文件/列。谢谢 from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter from pdfminer.converter import TextConverter from pdfminer.layout import LAParams from pdfminer.pdfpage import PDFPage from cStringIO import StringIO import xlsxwriter # Create a workbook and add a worksheet. workbook = xlsxwriter.Workbook('Stafford_Capital.xlsx') worksheet = workbook.add_worksheet() def convert_pdf_to_txt(path): rsrcmgr = PDFResourceManager() retstr = StringIO() codec = […]