Tag: csv

导出到Excel – 中间文件格式?

我试图导出非常大量的数据(300.000行* 100列)到Excel(从Delphi应用程序)和OLE方法(DevExpress DX,CX套件的组合解决scheme和出自己的代码)给错误消息没有足够的存储是可用的完成这个操作 , 创buildvariables数组时出错 。 没有好的,准备第三方组件的本地出口,因为我有想法使用中间文件: 我可以导出数据在一些中间文件,然后在Excelt中打开此文件。 但是什么样的格式最适合这种行动呢? :DDD CSV是最简单的一种,但是Excel可以从CSV数据中恢复列格式 – 对我们来说非常重要的一点是,货币数据是以数字forms导出的,并且可以在其上进行计算,该date数据以dateforms导出。 CSV没有这种types的信息。 XML似乎很有希望,因为可以将数据types和格式添加到数据中,但Excel需要的XML格式是什么? 数据库文件似乎很有希望,但它是相当古老的,我不知道是否没有数据量的限制。 我正在寻找Delphi 6的解决scheme。

打开CSV,将粘贴范围复制到工作簿

我无法将复制的范围粘贴到目标工作簿中。 我有一个.csv文件,将有一个工作表,但每次导出.csv工作表名称将会不同。 有人可以看看我的代码,让我知道,如果你看到任何突出的东西,将会搞砸了。 代码运行到Target.Copy (目标范围被选中并复制)。 但是我必须将这些值粘贴到目标工作簿的代码似乎没有工作。 我有时会得到这个错误信息: Sub Opencsv() Dim FilesToOpen Dim wkbTemp As Workbook, wkbDest As Workbook Dim sh As Worksheet Dim Last As Long Dim Target As Range Dim LastRow As Long, LastCol As Long FilesToOpen = Application.GetOpenFilename(Title:="Text Files to Open") On Error Resume Next Last = fLastRow(wkbDest) Set wkbTemp = Workbooks.Open(filename:=FilesToOpen, Format:=4) […]

创buildHive表并从xls文件插入数据

我已经从我的主pipe得到了一个项目任务,声称可以在HDInsight中使用Hive(对于Windows)来查询两种不同的文件types,然后从中提取数据。 其中一个文件是.xls,另一个是.csv文件。 我已经设法将这两个file upload到Hadoop集群与VS,然后尝试创build一个Hive表.xls文件(我使用的教程之前使用.csv文件与Hive工作得很好),但与.xls文件时,我经常收到“失败”错误时尝试。 我尝试了下面的示例代码来创build表,分隔,字段终止(我尝试了几个没有成功),文件types(不知道还有什么其他用途)和目标位置。 DROP TABLE IF EXISTS table1; CREATE EXTERNAL TABLE IF NOT EXISTS table1(id int, postcde int, city string) ROW FORMAT DELIMITED FIELDS TERMINATED BY ' ' STORED AS TEXTFILE LOCATION 'wasb://container@resourcegroup.blob.core.windows.net/folder1/data.xls/' 我不确定这是否可能,因为似乎对这里的类似问题似乎有矛盾的回应,但根据我的主pipe,应该有可能与Hive做到这一点 – 无需将文件types转换为在上传到Hadoop之前使用相同的格式! https://community.hortonworks.com/questions/31968/hi-is-there-a-way-to-load-xlsx-file-into-hive-tabl.html

在列中转换地址(10000)信息的大列表,然后在csv中上传到mysql中

我有Excel / LibreOffice Calc / Word / LibreOffice Writer中的地址列表(大约10000)。 我需要将它们上传到一个Mysql表中。 每个公司的领域和信息都发生了变化……但是一个粗糙的结果是: Company A FirstName LastName Titel Address Phone Email Website Company B FirstName LastName Titel Address Phone Email Website Company C FirstName LastName Titel Address Phone Email Website … 很明显,我可以一一复制 – >过去特殊 – >调换他们垂直信息作为第一步。 目标: Column1|Column2|Column3|Column4|Column5|Column6 Company A | FirstName LastName Titel | Address | […]

Apache POIparsing并处理空单元格

我正在使用java servletparsing上传的excel文件, 我得到的文件为inputstream,并制作工作簿,然后我想要循环虽然所有的单元格,包括空的,现在这是我在做什么,这将处理在数据中间的空单元格,但如果有一行是完全空的,然后是数据失败后的一行 for (int i = 0; i < mySheet.getPhysicalNumberOfRows(); i++) { Row row = mySheet.getRow(i); for (int j = 0; j < row.getPhysicalNumberOfCells(); j++) { Cell cell = row.getCell(j); } } 所以这是我的行 item item item //this row is empty item item item 这是失败,我怎么处理这个? 谢谢您的帮助

CSV文件中特定单元格的VBA脚本计算

我试图确定在我的VBA脚本中的一个单元格内产生3个值的计算的最佳方法: 该脚本是当前的格式: Function BuildValuesString(colIndex As String, rows As String) As String Dim val As Variant For Each val In Split(rows, ",") If Cells(val, colIndex) <> "" Then BuildValuesString = BuildValuesString & Cells(val, colIndex).Value & "," Next val End Function Function BuildNullStrings(numNullStrings As Long) As String Dim iNullStrings As Long For iNullStrings = 1 To numNullStrings […]

使用Roo和Ruby(Rails)来parsingExcel

我试图让用户上传一个CSV / Excel文档,并使用Roo(我见过的最常见的一个)parsing它,但我有一些问题搞清楚了。 当前脚本 require 'roo' xlsx = Roo::Excelx.new("./TestAppXL.xlsx") xlsx.each_row_streaming do |row| puts row.inspect # Array of Excelx::Cell objects end 这是我能够得到的唯一工作 – 它返回看起来是JSONB的东西。 我想要做的是几个过程: A)用户上传一张“卡片”列表到我的网站(尽量允许尽可能多的选项,CSV,Excel等) B)它立即返回标题列表并询问“哪个标题是名称,数量等等?” C)我parsing数据的具体标题,做'X'。 B是我主要需要帮助的。 我正努力弄清Roo。 我将无法控制标题,所以我不能使用数字列号。 (添加Rails标签,因为这将最终在一个控制器中,也许是一个更简单的方法来做到这一点)。 更新的脚本 我其实已经取得了很多进展。 仍然试图接近我原来的要求。 require 'roo' require 'roo-xls' xlsx = Roo::Spreadsheet.open('Demo.xls') headers = xlsx.first_row puts xlsx.row(headers) puts "Which number header is the Card Name?" CardName […]

如何轻松将具有奇怪date格式的CSV转换为指定的格式?

这是一个比编程更多的数据相关的问题,但我不知道还有什么地方可以发布。 如果它更适合其他地方,更改器可以自由移动它。 我试图导入银行导出的CSV到GNUcash,但GNUcash只采用特定的date格式,如YYYY-MM-DD(1999-05-16),而我的银行只出口YYYYMMDD(19990516)。 我不知道最简单/最方便的方法是转换文件使用。 写一个脚本和/或使用复杂的正则expression式似乎是过度的,但可能是必要的? 我试图将其加载到LibreOffice Calc和MS Excel中,但找不到任何转换选项; 使用自定义的YYYYMMDD格式格式化单元格会打破输出。 我希望有一个更简单的方法来解决这个问题。 如果没有,我可能只是写了这个脚本,并把它放在网上的地方。

Csvkit库使用情况

我正在寻找转换给定的Excel文件为csv使用csvkit作为库,而不是从命令行。 我无法find有关库使用语法的任何信息。 任何人都可以阐明如何使用csvkit作为这个目的的图书馆? 我的testing用例很简单 – 使用input.xlsx或input.xls,转换并保存为output.csv。 这是我迄今为止所尝试的,这是基于其他地方的build议: import csvkit with open('input.xlsx') as csvfile: reader = in2csv(csvfile) # below is just to test whether the file could be accessed for row in reader: print(row) 给 Traceback (most recent call last): File "excelconvert.py", line 6, in <module> reader = in2csv(csvfile) NameError: name 'in2csv' is not defined 这里还有一个类似的问题,但是答案似乎只是引用那些没有启动或没有真正解释库使用语法的文档,而只是列出了类。 […]

使用Talend操作CSV文件时,发送分隔符“\ t”

我在csv文件中使用Talend做一些filter,分隔符是“\ t”选项卡。 但是在输出中,分隔文件中的所有字段都显示为单列! 这是我的工作和我的输出文件的设置 这是从我的csv文件在input的截图 这是我的tFileInputDelimited setiing,我使用相同的元数据来读取input和输出中的文件 谢谢你的帮助!