Tag: parsing

我怎样才能在Java中parsingCSV(excel,不以逗号分隔)文件?

我有一个CSV文件(excel),里面有数据,我需要使用javaparsing数据。 这些文件中的数据不会使用逗号分隔,CSV文件具有写入所有数据的列数和行数(每个单元都有数据)。 我需要通过所有的文件,直到我到达每个文件的EOF(文件的结尾),并parsing数据。 该文件也包含空行,所以空行不是一个标准停止parsing,我认为只有EOF将表明我已经达到特定文件的末尾。 非常感谢。

“状态”是否总是从后续行开始parsing?

原始post太长: 使用Spreadsheet :: ParseExcel在XLS文件中获取零个单元格 xls的数据结构 文件看起来相似如下: col1 col2 col3 col4 col5 row1 School 1 row2 Dean John row3 No.stu. 55 row4 some irrelevant stuff row5 School2 2 row6 Dean Tony row7 No. stu. 60 row8 some irrelevant stuff row9 School 3 row10 Dean James row11 No.stu. 56 row12 No. teacher 20 row13 School 4 row14 […]

当本地运行JS-XSL演示时,JavaScript:“Uncaught SecurityError”

(这个问题与这里find的JS-XSL演示有关) 简单地告诉你这个演示是为了什么; 它将MS Excel文件作为input,parsing数据,并以纯文本格式输出数据。 我下载了软件包(zip)并在本地运行,只需通过Chrome打开html文件。 问题是,我似乎无法克服以下错误: Uncaught SecurityError: Failed to construct 'Worker': Script at 'file:///C:/Users/David/Desktop/Xlsx%20Demo/xlsworker.js' cannot be accessed from origin 'null'. 而上面的错误指向第35行的html文件,它具有以下代码: /* I changed the file path from './xlsworker.js' to 'xlsworker.js' */ var worker = new Worker('xlsworker.js'); 这个演示文件只有三个文件:html文件本身和两个javascript文件,一个名为xls.js ,另一个名为xlsworker.js 。 所有这三个文件都在相同的目录中,并在同一级别。 对我来说更让人费解的是,我几个月前成功地运行了这个相同的演示! 我无法想象如果我现在做了什么不同的事情。 任何见解?

除Excel外,无法识别CSV文件中的列

我有一个以下的CSV文件: col1;col2;col3;col4 row11;row12;row13;row14 row21;row22;row23;row24 row31;row32;row33;row34 row41;row42;row43;row44 现在,这个文件可以很好地在Excel中打开,它可以识别列和行的分隔,但是我尝试过的其他软件(一些专门用于CSV编辑,另一些用于其他用途,比如我用来导入CSV的HeidiSQL文件到表),所以这提出了一个问题。 200行左右,有30左右的柱子,所以手工做这件事真的很难。 你知道一种方法,使这是一个“正确”的CSV? 谢谢!

Excel公式中parsing出这个string的最好方法是什么?

我有一列数据,每个单元格都是这样的: Last First (Id) 如 : Thompson Joe (ABC12323) 我想parsing出: ABC12323 注:在一些罕见的情况下,我看到有这样列出的两个id: Thompson Joe (ABC12323) (DEF1123432) 在这种情况下,我想parsing出第二个 DEF1123432 在excel公式中最简单的方法是什么?

VB.NET TryParse返回False,虽然有效的date通过

我在VB.NET中创build了一个检查有效date的函数。 function如下: Public Shared Function IsDate(obj As [Object]) As Boolean Dim strDate As String = obj.ToString() Dim dt As DateTime = DateTime.MinValue If DateTime.TryParse(strDate, dt) AndAlso dt <> DateTime.MinValue AndAlso dt <> DateTime.MaxValue Then Return True Else Return False End If End Function 我将一个值传递给我认为是有效date的函数。 我的testing值是49278,应该对应于2034年11月30日的date。 然而我的function告诉这不是一个有效的date。 我不明白为什么。 这里发生了什么?

在Spreadsheet :: ParseExcel中识别datetypes

我们正在从基于MS Excel OLE的模块迁移到Spreadsheet::ParseExcel (或类似的)。 由于我们有数百个程序正在使用我们的模块,所以我们希望我们提供一个替代品,即返回的数据是相同的。 问题是date – 使用Excel,我们得到一个types为VT_DATE的Win32::OLE::Variant对象。 作为一个解决方法,我们可以通过检查$cell->type() eq 'Date'并返回对象来手动构build。 问题是types不可靠,所以我们不能总是这样做。 Datetypes设置在两个地方。 这是FmtDefault.pm使用的逻辑: if ( ( ( $iFmtIdx >= 0x0E ) && ( $iFmtIdx <= 0x16 ) ) || ( ( $iFmtIdx >= 0x2D ) && ( $iFmtIdx <= 0x2F ) ) ) { return "Date"; } 如果检查失败,我们得到Numeric ,那么它在ParseExcel.pm中进行备份检查: if ( $FmtStr =~ m{^[dmy][-\\/dmy]*$}i […]

Excel 2010parsing出可变长度文本string的部分

我的数据通常是CMB1.I2.CB3.str01 / 02 +或01-02.01 +,或者是一些随机的变化。 我认为最糟糕的情况是AR1.IN2.CM3.ST04 / 05 +。 现在我有A2-A1000列,B列,C列,D列等完整的string数据我试图分开完整的string的部分。 我通过在excel中使用left , mid, len and search函数来分隔string,并且让用户input分隔符(在本例中为all,但有时是 – 或/等)。 所以我的公式看起来像这样 使用此示例AR1.IN2.CM3.ST04/05+在单元格A5中,分隔符/分隔符(。's)在单元格B2 – D2 A5: AR1.IN2.CM3.ST04/05+ A6: A1.I2.CM3.ST06/07- A7: 01.03.4.8/9+ B5:AR1 eq in b5: =LEFT(A5,SEARCH($B$2,A5,1)-1) C5:IN2 eq in C5: =MID(A5,LEN(B5&$B$2)+1,SEARCH($C$2,A5,LEN(B5&$B$2)+1)-LEN(B5&$B$2&$C$2)) D5:CM3 在D5中的Eq: =MID(A5,LEN(B5&$B$2&C5&$C$2)+1,SEARCH($D$2,A5,LEN(B5&$B$2&C5&$C$2&$D$2)+1)-LEN(B5&$B$2&$C$2&C5&$D$2)) E5:ST04 / 05 + E5中的E5: =RIGHT(A5,LEN(A5)-LEN(B5&$B$2&C5&$C$2&D5&$D$2)) 我的方程式工作正常,但我希望有一个更简单的方法? 当我试图向他们解释每个配方在做什么的时候,我的同事们都瞪大了眼睛

如何从文本文件中提取特定的单词到xls电子表格中

我是VBA新手。 在这里发布我的问题之前,我花了近3天的时间浏览互联网。 我有300多个文本文件(使用OCR从PDF转换的文本),从文本文件。 我需要将所有包含“字母”和“数字”的单词(例如KT315A,KT-315-a等)与源参考(txt文件名)一起获得。 我需要的是 1.添加“智能filter”,将只复制包含的单词 “字母”和“数字” 将复制的数据粘贴到A列 将参考文件名称添加到B列 我发现下面的代码可以将文本文件中的所有数据复制到Excel电子表格中。 文本文件看起来像 “从252A-552A到ddddd,,,, @,@,rrrr,22,…. kt3443,fff ,,,等” xls的最终结果应该是 A | 乙 252A-552A | 文件1 kt3443 | 文件1 Option Explicit Const sPath = "C:\outp\" 'remember end backslash Const delim = "," 'comma delimited text file – EDIT 'Const delim = vbTab 'for TAB delimited text files Sub ImportMultipleTextFiles() […]

Excel:parsing地址

我已经在泰国网站上search了一些餐馆的数据。 我目前有一个地址字段的问题,因为在网站上的地址搬到下一行时,刮了决定结合它,而不是留下任何空间。 例如: 22/F, Dusit Thani Bangkok946 Rama 4 RoadBangkokThailand 1/F, Oakwood Residence113 Thonglor Soi 13BangkokThailand G/F, Ocean Tower IISukhumvit Soi 21WattanaBangkokThailand 在第一个条目中,我希望k和9之间以及d和B之间有一个空格,其他条目也是如此。 我目前正在使用BeautifulSoup从这里刮取数据。 如果任何人都可以帮我解决这个问题,或者更好的方法来刮去HTML我都听过。 我宁愿不要手动更改280+地址条目。