Tag: parsing

将文本字段parsing为excel列

我试图parsing超过20,000条logging的数据。 每个logging有4个字段,前面加上2个字母数字值。 下面是一个2logging的例子。 我目前有一个臃肿的解决scheme,使用基于这里的链接的Java: 使用JavaparsingHTML数据(DOMparsing) 。 但是我不打算使用这个解决scheme,因为这只是分离logging而已。 有没有一种解决scheme,使用VBS,Python或任何其他语言,可以根据我已经使用的逻辑分开领域? 还是另一个逻辑的方法 100000000 SMP008483 |— Category Western |— Model Ford |— Asset Delivered Date ? |— Scheduled ? 100000001 SMP008484 |— Category Eastern |— Model Chevrolet |— Asset Delivered Date ? |— Scheduled ? 预期的输出在这里: ID1 ID2 Category Model Asset Delivered Date Scheduled 100000000 SMP008483 Western Ford ? […]

使用VBA将网页数据传输到Excel工作表

这是我的第一篇文章。 我是VBA新手,但对VB6非常熟悉。 我编写了一些代码,将来自nasdaq的文本粘贴到工作表中。 它终于起作用了。 “年度利润表”上下分散着大量的无关数据。 我想parsing出来,并把重要的数据放在一个可以自动分析的地方。 我想我可以search单元格,直到find:Annual Income Statement(年度损益表)并将其提取到其他表单中。 任何build议将非常感激。 这是我得到的: Sub TransferWebData() Dim IE As Object Set IE = CreateObject("InternetExplorer.Application") With IE .Visible = True .Navigate "http://www.nasdaq.com/symbol/gd/financials" Do Until .ReadyState = 4: DoEvents: Loop IE.ExecWB 17, 0 'SelectAll IE.ExecWB 12, 2 'Copy selection Sheets("GD").Range("A1").Select Sheets("GD").PasteSpecial Format:="HTML", Link:=False, DisplayAsIcon:=False, NoHTMLFormatting:=True IE.Quit End With End Sub

使用pythonparsingExcel中的数据

在Excel中,我必须将下面的值从一个单元格分成两个: 2016-12-12 (r=0.1) 2016-12-13* (r=0.7) 如何在Python中这样做,以便在Excel文件中,date和“r =#”将在不同的单元格中? 还有,有办法自动删除“*”的标志?

c#chart.object从Excel作为.png低分辨率

我创build了一个excel文件,并希望将其内容导出为png或jpeg文件。 不幸的是,图像的质量是非常低的。 有针对这个的解决方法吗? 我希望一个真正的高分辨率的图片。 谢谢 我目前的代码(来自互联网): Excel.Range xlRange = xlWorksheet5.get_Range("A1", "K30"); xlRange.CopyPicture(Excel.XlPictureAppearance.xlScreen, Excel.XlCopyPictureFormat.xlPicture); Excel.ChartObject chartObj; chartObj = xlWorksheet5.ChartObjects().Add(xlRange.Left, xlRange.Top, xlRange.Width, xlRange.Height); chartObj.Activate(); string path_image = path + "\\image.png"; Excel.Chart chart = chartObj.Chart; chart.Paste(); chart.Export(path_image);

如何parsing包含xxx的单元格的一部分,并将数据复制到另一个单元格?

我有一个Excel文件,我想parsingD列中的每个单元格的开始,并复制和粘贴在单元格(相同的行,列B)的数字我如何parsing数字0到9和“。 并将该值xxxx复制到列B? D列的单元格起始处没有多less个数字和句点的标准格式,可以是1.3.4或1.3.4。 或1.3 ect … ===================================================================== 'DIMENSIONING VARS AND PATHS Dim Level As Range Dim i, j, q(1 To 50) As Long Dim numofchar As Long Dim filepath As String Dim filename As String Dim PN As String Dim HEADERrowcallout As Long Dim LASTREQrowcallout As Long Dim REQTEXTcolumncallout As String Dim x As Long […]

从txt文件中获取数据,parsing并放入CSV

我一直在网上寻找一个解决我的确切问题,但所有的答案都过时了。 我有一个文本文件包含这种forms的数据: 第一个名字:xxx 中间名:xxx 姓:xxx 生日:xxx 高度:xxx 重量:xxx 地址:xxx CITY,STATE ZIP:xxx 文件中有多个条目。 我需要从“xxx”中获取数据,基本上每个“:”后的所有数据都放在一行中,每个“xxx”用逗号隔开。 这是我可以使用它作为一个CSV文件。 我想把这个信息放入Excel工作表中。 所以我希望它看起来像这样: firstname,middlename,lastname,birthday,height,weight,address,citystatezip 这就是我所拥有的,我不知道从哪里走。 with open('info.txt') as file: for rec in file: print rec.split(':')[1] 这段代码只是假设在“:”后面打印每个东西。 我不能真正把它工作,也不知道我将如何把它放在我想要的格式。

使用Python在文件夹结构中的文档中查找关键字

我想知道是否有人知道如何在文档中查找关键字,然后将这些文字导出到Excel文档中。 例如,我在文件夹A>文件夹B中有一个名为“test”的文档。我想要进入该文件夹,find名为“test”的文档,打开该文件,find关键字“test”,然后导出“testing“到一个excel文件。 我问的原因是有成千上万的文件夹需要这样做。 我已经看了其他解决scheme,他们build议pdfminer,但我不知道如何跨多个文件夹/子文件夹运行,并将关键词导出到Excel文档。 这是我迄今为止。 它能够将PDF转换为文本,然后从文本中查找关键字。 不知道我怎么能够将这些数据导出到Excel文件/列。 谢谢 from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter from pdfminer.converter import TextConverter from pdfminer.layout import LAParams from pdfminer.pdfpage import PDFPage from cStringIO import StringIO import xlsxwriter # Create a workbook and add a worksheet. workbook = xlsxwriter.Workbook('Stafford_Capital.xlsx') worksheet = workbook.add_worksheet() def convert_pdf_to_txt(path): rsrcmgr = PDFResourceManager() retstr = StringIO() codec = […]

Excelparsing和转换文本

我需要能够根据以下规则将单元格从一种格式转换为另一种格式: Property Description –enter as– Folio Identifier ———————————————————- Lot 23 DP789678 23/789678 Lot 7 Section 12 DP6789 7/12/6789 Lot 1 SP 45676 1/SP45676 Common Property Title SP45676 CP/SP45676 Volume 7456 Folio 56 7456-56 Auto-Consol 5674-78 5674-78 Water Access Licence No. 123 WAL123 所以左边的东西必须改成右边的东西。 例如,如果我有任何看似Lot 23 DP789678的单元格,则必须将其转换为Lot 23 DP789678。 我怎么写一个公式,将这样做的所有上述情况?

PHP的Excel读者:获得删除/删除线值

我正在寻找方法来parsingExcel工作表中单元格的三明治/删除线值,如果可能的话使用PHP脚本。 删除或不包含简单的文本值(没有公式或任何东西)的单元格。 我尝试使用http://code.google.com/p/php-excel-reader/和其他几个脚本。 但是我还没有find任何PHP脚本来parsing这个特定的值(删除),我试着没有成功地将这个parsingfunction添加到php-excel-reader中。 我已经尝试添加以下内容: function lineTrought($row,$col,$sheet=0) { return $this->fontProperty($row,$col,$sheet,'strikethrough'); } 并且在这部分parsing代码中添加一些代码(用**表示): case SPREADSHEET_EXCEL_READER_TYPE_FONT: $height = v($data,$pos+4); $option = v($data,$pos+6); $color = v($data,$pos+8); $weight = v($data,$pos+10); $under = ord($data[$pos+14]); **$strikethrough = v($data,$pos+16);** $font = ""; // Font name $numchars = ord($data[$pos+18]); if ((ord($data[$pos+19]) & 1) == 0){ $font = substr($data, $pos+20, $numchars); } else { […]

使用VBA查询xml属性值并将其parsing为XLS

我试图打开/加载在B2范围内的Excel工作表中指定的XML文件。 然后,searchname=FUNCTIONAL_ITEM的XML属性列表,并获取">后的所有属性值。 在下面的例子中,我想提取出值8和10 。 <Attribute name="BIN" dataType="String" unit="" multiplier="" tag="LINE,MRPM">1</Attribute> <Attribute name="FUNCTIONAL_ITEM" dataType="Double" unit="" multiplier="" tag="LINE,LINE DB">8</Attribute> <Attribute name="FUNCTIONAL_ITEM" dataType="Double" unit="" multiplier="" tag="LINE,LINE DB">9</Attribute> <Attribute name="FUNCTIONAL_ITEM" dataType="Double" unit="" multiplier="" tag="LINE,LINE DB">10</Attribute> 有人可以指出我正确的方向来实现这一点。