Tag: csv

Pythonpandasread_excel dtype str在读取或通过to_csv写入时,用空白('')replacenan

Python版本:Python 2.7.13 :: Anaconda自定义(64位)pandas版本:pandas 0.20.2 你好, 我有一个相当简单的要求。 我想阅读一个Excel文件,并写入一个特定的工作表到CSV文件。 在编写csv文件时,应将源Excel文件中的空白值作为空白处理/写入。 但是,我的空白logging总是写入输出文件的“南”。 (没有引号) 我通过方法读取Excel文件 read_excel(xlsx,sheetname ='sheet1',dtype = str) 我指定dtype,因为我有一些列是数字,但应被视为string。 (否则,他们可能会失去前导0等),即我想读取每个细胞的确切值。 现在我通过to_csv(output_file,index = False,mode ='wb',sep =',',encoding ='utf-8')输出.csv文件。 但是,我的结果csv文件包含来自excel文件的所有空白单元格的nan。 我错过了什么? 我已经尝试过.fillna('',inplace = True)函数,但似乎没有对我的数据做任何事情。 我也尝试将参数na_rep =''添加到to_csv方法,但没有成功。 谢谢你的帮助! 附录:请在下面find一个可重复的例子。 请在下面find一个可重复的示例代码。 请首先用2列创build一个新的Excel文件,内容如下:COLUMNA COLUMNB COLUMNC 01testing02testing 03testing (我将这个Excel文件保存到c:\ test.xls请注意,列B的第一行和第三行以及列C的第二行是空的/空的) 现在这是我的代码: import pandas as pd xlsx = pd.ExcelFile('c:\\test.xlsx') df = pd.read_excel(xlsx, sheetname='Sheet1', dtype = […]

将CSV传递到Excel工作簿(不是来自文件)

我有一个包含日志条目的CSV文件的文件夹。 对于CSV的每个条目,如果Risk属性不是Low且不是None,那么我把它放在一个累积CSV对象中。 从那里, 我想直接导入到Excel工作簿,而不必将CSV保存到文件 。 $CSVPaths = (Split-Path $PSCommandPath) $AccumulateExportPath = (Split-Path $PSCommandPath) $FileName="Accumulate" $Acc=@() Foreach ($csv in (Get-ChildItem C:\Scripts\Nessus\Sheets |? {$_.Extension -like ".csv" -and $_.BaseName -notlike "$FileName"})) { $Content = Import-CSV $csv.FullName Foreach ($Log in $Content) { If ($Log.Risk -ne "None" -and $Log.Risk -ne "Low") { $Acc+=$Log } } } $CSV = $ACC |ConvertTo-CSV […]

在Excel中将date格式数据转换为python中的csv文件时输出错误

我有这个excel表,我试图将这个excel表转换成csv文件。 本表中的列是以date格式(如7/4/2017年7 date )的数据列。 我写了这段代码,但是这不是正确地转换date字段数据: import xlrd import csv def Excel2CSV(ExcelFile, SheetName, CSVFile): workbook = xlrd.open_workbook(ExcelFile) worksheet = workbook.sheet_by_name(SheetName) csvfile = open(CSVFile, 'w',encoding='utf8') wr = csv.writer(csvfile,delimiter=';') for rownum in range(worksheet.nrows): wr.writerow(worksheet.row_values(rownum)) csvfile.close() 我在Excel中的示例数据是这样的: 4/7/2017 value02 value03 4/5/2017 value12 value13 4/14/2017 value22 value23 4/10/2017 value32 value33 当我执行我的上面的代码,这是在输出中看到: 42832.0;value02;value03 42830.0;value12;value13 42839.0;value22;value23 42835.0;value32;value33 正如你所看到的date提交数据没有得到正确的转换。 我在这里犯了什么错误?

将Excel或CSV文件转换为Python中的电子邮件地址列表

我有一些Python的经验,但我不是一个专家,所以在这里我很容易。 我有一个Python脚本,可以自动发送电子邮件报告给全天的人们。 现在,电子邮件地址都存储在脚本本身,但我希望将电子邮件地址存储在外部文件,其他人可以编辑谁收到他们,而不必打开脚本本身。 脚本中有不同的电子邮件列表,我正在努力弄清楚如何将其转换为文件。 因此,例如,这些可能是三个电子邮件列表,因为它们将被存储在Python中: Group_A = ['ABC@yahoo.com', 'def@gmail.com'] Group_B = ['xyz@yahoo.com', tuv@gmail.com'] Group_C = ['hij@yahoo.com', klm@gmail.com'] 我如何将它们存储在外部文件中并让Python将它们作为单独的列表读取? 我很好地使用Excel(通过Openpyxl或Pandas读取)或CSV甚至txt文档,但是让Python读取文件并将电子邮件地址存储在自己的列表中的最佳方式是什么? 列表的名字也需要在文件中设置,因为每个列表都会根据它的名字得到一个单独的电子邮件。

exception:exception('在工作簿析构函数中捕获的exception。工作簿可能需要显式的close()',)

我试图把一堆CSV文件放到一个工作簿中,这里是我的代码: import csv import glob import openpyxl import os, sys import pandas as pd import xlsxwriter as xlwr def main(): list_of_files = [] names = [] for csv_file in glob.glob(os.path.join('.', '*.csv')): bleh = csv_file[2:] name = bleh[:-4] names.append(name) df = pd.read_csv(csv_file, index_col=None, header=0) list_of_files.append(df) writer = pd.ExcelWriter('non_concussed_game_logs.xlsx') for n, df in enumerate(list_of_files): df.to_excel(writer, '%s' % […]

VBA – 将上传的.csv文件名放置在某个表单元格中

我想知道是否有一种方法可以将选中的.csv文件放在“汇总”表格中的单元格中。 这里是上传.csv文件的代码: Dim ws As Worksheet, strFile As String Set ws = ActiveWorkbook.Sheets("Input Raw Data") 'set to current worksheet name strFile = Application.GetOpenFilename("Text Files (*.csv),*.csv", , "Please select text file…") With ws.QueryTables.Add(Connection:="TEXT;" & strFile, Destination:=ws.Range("A1")) .TextFileParseType = xlDelimited .TextFileCommaDelimiter = True .Refresh End With 我不确定是否有办法做到这一点,在此先感谢。

将CSV文件转换为Excel后,整数存储为string – 如何将其转换回来?

在这个项目中,我已经将一个csv文件转换为一个xls文件和一个txt文件到一个xls文件。 目标是比较两个xls文件的差异,并打印出第三个excel文件的差异。 但是,当打印差异时,它们包含任何整数大于999的条目,因为从我的转换后的csv文件中的任何整数都被视为string而不是整数。 因此,由于转换后的csv excel文件中的逗号,它会将诸如1200(在我的转换后的xls文件中)的值与1200(在我的转换后的txt文件中)的值不同。 我的问题是:有没有办法将string解释的整数转换回被解释为整数? 否则,有没有办法从我的xls文件中删除所有的逗号? 我尝试了通常的dataframe.replace方法,它是无效的。 以下是我的代码: #import required libraries import datetime import xlrd import pandas as pd #define the time_handle function to name the outputted excel files time_handle = datetime.datetime.now().strftime("%Y%m%d_%H%M") #identify XM1 file paths (for both csv origin and excel destination) XM1_csv = r"filepath" XM2_excel = r"filepath" + time_handle + ".xlsx" #identify […]

无法正确find/replace

我有一个CSV文件,我试图从中删除HTML标签,并且所有行都返回。 使用<*>执行查找/replace操作会返回“此公式存在问题”错误。 尝试\<*>得到错误“我们找不到任何要replace的东西”。 尝试这个VBA什么都不做 – 它运行成功,但所有的标签仍然存在: Sub t() With Range("A1:AE60165") .Replace Chr(10), " " .Replace Chr(13), " " .Replace vbCr, " " .Replace vbLf, " " .Replace vbCrLf, " " .Replace "<*>", "" End With End Sub 该macros也不会删除任何换行符或回车符。 用Char!10)或Char(13)做一个查找/replace也不会做任何事情。 我试过的最后一件事是Worksheetfunction.Clean(Range("A1")) ,它也什么都不做。 但如果在A2 ,我使用=CLEAN(A1) ,它成功地删除了换行符。 尽pipe数据集非常大,但是我不能在所有的单元格上这样做。 我甚至无法从所有单元格中成功删除@ 。 我刚刚运行它,它删除了23个实例,但即使我select的单元格有一个@但没有被删除。 我怀疑这是CSV的东西,因为我不知道它为什么如此复杂。 这是一个很多的数据,所以一个函数不可能是最好的select。 这可能是一些Unicodetypes的问题? 编辑:FWIW,我使用profiles.csv在这里find,因为我学习Python它只是玩弄。 这里有一个pastebin链接到less量的数据,但我不知道它在该网站“翻译”有多好。

Excel VBA,保存为.txt时保持格式化

我正在导入一个固定宽度的文本文件到Excel然后导出它。 我试图找出如何保存格式时保存。 在导入时,我尝试过使用.NumberFormat,它在导入时强制格式化,但在导出时忽略格式。 我已经导入的文本文件: 我的出口例程: Option Explicit Sub CreateFixedWidthFile(strFile As String, ws As Worksheet, s() As Integer) Dim i As Long, j As Long Dim strLine As String, strCell As String 'get a freefile Dim fNum As Long fNum = FreeFile 'open the textfile Open strFile For Output As fNum 'loop from first to last […]

使用ssconvert从.xlsx创buildTAB分隔的值

由于单元格值内的逗号,我无法使用.xls(x)的ssconvert实用程序进行csv转换。 是否有可能使用ssconvert (命令行电子表格格式转换器)直接从xlsx创build制表符分隔值? ssconvert infile.xlsx outfile.tsv引发Unable to guess exporter to use错误。 因此,我试图在一些导出选项的规范下生成一个原始文本文件,特别是分隔符: ssconvert -O 'separator=\t format=raw' infile.xlsx outfile.txt 这导致输出如value1\tvalue2\tvalue3 ,即string\t不会被转换成tabulator。 有什么build议么?