Tag: python

如何读取gzip格式的文本文件,而不解压缩使用python写入该行excel?

问题陈述:我有一个包含gzip文件的目录,每个gzip文件都包含一个文本文件。 我已经写了一个代码,它解压所有的gzip文件,然后用于读取每个解压缩的文本文件,然后将该输出结合到一个文本文件,然后应用一个条件,如果条件符合,然后写入Excel。 上面的过程有点乏味和冗长。 任何人都可以帮助我写出代码,直接从txt文件中读取数据,并将其写入excel。

Pythonpandas如何在Excel中写入数据

我不能在Excel中写入数据。 在DataFrame()指定函数需要哪些参数? import pandas as pd table = pd.read_excel("file1.xlsx", sheetname="file1") lastval = table['lastval'].values.tolist() newval = table['newval'].values.tolist() rm = table['rm'].values.tolist() itog = [0, 0, 0] for i in range(3): itog[i] = (newval[i]-lastval[i]) * rm[i] pd.DataFrame(?????)

使用win32com的excel格式不会自动更新

我正在尝试使用win32com在excel中生成报告。 我可以把信息input到正确的单元格中。 但是,我的某个列包含一个ID号,而Excel将其格式化为一个数字(以科学记数法显示)。 我已经尝试使用sheet.Range(cell).NumberFormat = '@'作为文本格式化单元格,它将工作,但只会在实际的Excel文件中select单元格后更新。 无论我在input数据之前还是之后格式化单元,都会发生同样的情况。 有没有办法使用win32com刷新单元格格式? 我希望一旦com实例变得可见,就可以正确显示ID号。

parsingJSON到Excel – Python

我试图查询Azure AD的一些数据,返回JSON。 我想采取这些数据的一部分,并填写一个Excel表。 我已经检查了很多从JSON转储所有数据到Excel表格(使用xlwt)的例子,但是我怎样才能完成JSON数据的一部分? 这是我正在使用的脚本: import requests def get_application_list(): application_list_response = requests.get("https://graph.microsoft.com/beta/applications", verify=False, headers={"Authorization": "Bearer" + access_token}) application_list_response_json = application_list_response.json() for item in application_list_response_json['value']: print("Application Name:", item['displayName']) print("Application ID:", item['id']) get_application_list() 我想在Excel表格中获取应用程序名称和应用程序ID。 示例输出: PS:我对Python很陌生。 任何build议来优化这个代码也是有帮助的。 谢谢!

无法从excel文件中以正确的格式读取date时间值,并使用python将其保存在数据库中

我有一段代码在Python中读取一个Excel文件并保存到红移数据库。 import psycopg2 def from_redshift(): book = xlrd.open_workbook("excelfile.xlsx") sheet = book.sheet_by_index(0) con = psycopg2.connect(dbname='dbname', host='something.com', port=portnum, user='username', password='password') cursor=con.cursor() query = """INSERT INTO table_name (col1, col2, col3, start_date, update_date) VALUES (%s, %s, %s, %s, %s)""" for r in range(1, sheet.nrows): col1 = sheet.cell(r,0).value col2 = sheet.cell(r,1).value col3 = sheet.cell(r,2).value start_date = sheet.cell(r,3).value update_date = sheet.cell(r,4).value […]

IOError:访问Excel文件时没有这样的文件或目录

我正在调用一个保存在桌面上的Python脚本的VBA代码。 这是我的一块VBA代码。 Shell "cmd /k C:\Python27\python.exe C:\Users\ashish.baboo\Desktop\UKT-SL-Ashish\Cleaning-Tools\Old-Geocode.py" waitTill = Now() + TimeValue("00:00:40") While Now() < waitTill DoEvents 这个Python脚本在放置在桌面的excel文件中加载地址。 当我直接运行python脚本,它执行完美。 但是当我运行的VBA代码,Python脚本打开,但给我一个错误,Excel文件不可用。 这里是我的Python脚本的代码: import xlrd import geocoder import openpyxl from openpyxl import load_workbook location = "C:\\Users\\ashish.baboo\\Desktop\\UKT-SL-Ashish\\Cleaning-Tools\\1.xlsx" workbook = xlrd.open_workbook(location) sheet = workbook.sheet_by_index(1) Rows = sheet.nrows Cols = sheet.ncols data = [[sheet.cell_value(r,c) for c in range(Cols)] for r […]

如何将iso8859_6中的文件名转换为utf-8?

我收到了数千个Excel文件来处理。 当我打开它们时,数据似乎被编码成可以用Python读取和处理的方式。 文件名称,但是,被打乱。 我将文件名导入到sqlite中,然后将它们的列表导出到CSV,然后用适当的编码尝试导入到Excel中。 这是他们在文件系统中的显示方式: 如果我告诉Excel导入为28596: Arabic (ISO) ,我假设映射到iso8859_6 python 3.5编码,这就是名称的显示方式。 Excel本身在导入后不能正确显示它们。 这是他们的样子,我认为这是一个字体问题。 无论如何,如果我将这些文件名导入到Python中,我不能无误地对它们进行编码/解码。 如果我设置错误ignore那么我没有看到文件名。 任何想法如何将这些编码到一个标准的Unicode阿拉伯文,将与我正在使用的所有其他阿拉伯文字一起正确显示? 下面是在Windows上的文件浏览器和MacOS上的Finder中出现的一个例子。 ½ñΘ Ω⌐αε δτßí ñáƒóƒ ƒΘª¼á ƒΘßá∩í Θ¼∞⌐ 4-2016.xlsx 编辑: 这是我在代码中尝试过的…我在sqlite数据库中有文件名,所以我从那里获取它们。 (顺便说一下,我正在处理的阿拉伯语的99.9%没有问题 – 只是这些文件名。) import dataset db = dataset.connect("sqlite:///mydata.sqlite") # Hit on one of the characters that appears in the garbled file names res = db.query("SELECT * FROM files […]

环路分离分离问题

我正在对这些数据进行循环。 我有一个问题:当我打印date,它出来:'2015.12。 0919 :45123.251',…我想避免很多循环,所以它不会放慢。 for line in sline: parts = line.split(',') 它只与“,”而在csv有一个“。” 在date和时间之间。 这当然会混淆代码,并在date和时间之间打印0919而没有分文。 excel / csv文件中有60,000行。 我怎样才能把“,”改成“”。 在Excel中的所有行中。 或者在代码中对其进行编程,以便更改或理解它。 2015.12.09,19:45,123.287,123.324,123.149,123.251,2914 2015.12.09,20:00,123.249,123.288,123.081,123.188,4000 2015.12.09,20:15,123.189,123.243,123.073,123.192,3463 2015.12.09,20 :30,123.193,123.267,123.119,123.242,3561 阅读csv的完整代码: lst = list() with open("CHFJPY15.csv", "r") as f: f_r = f.read() sline = f_r.split() for line in sline: parts = line.split(',') date = parts[0] time = parts[1] closeingtime = […]

忽略CSV上的重复行

我正在尝试读取一个CSV文件,并将其中的行写入另一个CSV文件。 我的input文件有重复的行。 在输出中,我只想要单行。 从我的示例脚本中,您可以看到我创build了一个名为“读者”的列表。 该列表获得了inputcsv的所有行。 然后在for循环中,我使用writer.writerow(读者[1] + ….),它基本上读取标题后面的第一行。 但问题是这第一行是重复的。 我如何调整我的脚本,使其只执行一次? for path in glob.glob("out.csv"): if path == "out1.csv": continue with open(path) as fh: readers = list(csv.reader(fh)) for row in readers: if row[8] == 'READ' and row[10] == '1110': writer.writerow(readers[1] + [] + [row[2]]) elif row[8] == 'READ' and row[10] == '1011': writer.writerow(readers[1] + [] + […]

读取Excel并将其转换为嵌套字典

我有一个像这样的结构的Excel文件 name age status anna 35 single petr 27 married 有没有什么通用的方法来将这样的Excel文件转换为嵌套的字典,像这样的结构 {'anna': {'age':35}, {'status': 'single'}}, {'petr': {'age':27}, {'status': 'married'}} 我应该先导入一个excel文件并将其转换为pandas数据框,然后创build一个嵌套的字典,或者是否存在导入excel表单并创build这样一个字典的直接方式?