添加基于“查找字符”的换行符并返回到第一个空格

我正在清理大量具有如下常见模式的数据:

注册编号:15082608date:15-JUN-15 BACKTRACK清除date:31-八月-15接收机构:13-MAY-15机构:奥克兰(每个logging约25个其他数据点,但遵循这种模式)。 包含一系列logging的原始PDF文件位于: http : //abc.ca.gov/reports/Actions2015/ActionsFinal_09-23-15.pdf

我不是一个程序员,但是,已经尝试了Refine和一堆Exceltesting,但是,还没有find一种方法,我可以做到这一点的大量的logging(数千,但将从几十:)开始。 所以,我的问题是:

脚本是否可以识别冒号“:”,然后回退到冒号前的第一个空格,例如“Date:15-JUN-15 BACKTRACK Cleared:Date:31-AUG-15”,然后为每个实例input一个新行? 所以得到的输出将是:

Date:15-JUN-15 BACKTRACK Cleared: Date:31-AUG-15 

另一个问题是,我可以手动将每个logging(所有25个以上的数据点)复制并粘贴到一个唯一的单元格中,但是最理想的是将PDF保存为电子表格,并且基本上为每一行都build立一行发现 – 在一些单元格中会有多个冒号,我需要脚本相应地击倒其他行。

一旦我到达那个地方,我可以做一个文本到列,然后从那里build立我的数据库。

select包含数据的单元格,并运行这个短的macros:

 Sub FixData() Dim r As Range, v As String, vOut As String For Each r In Selection v = r.Text vOut = "" If v <> "" Then ary = Split(v, " ") For i = LBound(ary) To UBound(ary) If InStr(1, ary(i), ":") > 0 Then vOut = vOut & vbCrLf & ary(i) Else vOut = vOut & " " & ary(i) End If Next i r.Value = vOut End If Next r End Sub 

之前:

在这里输入图像说明

之后:

在这里输入图像说明