Tag: pentaho spoon

在Pentaho的Switch / Case步骤中为每个案例生成一个Excel输出文件步骤

我有一个文本文件input步骤,从同一目录下的几个文件读取,并产生一个巨大的数据集。 我需要为Switch / Case语句中的每个案例生成一个excel文件输出,并根据数据集中某个字段的值为每个 excel文件命名。 这是可能的勺子? 任何帮助将不胜感激。

Pentaho Filter正则expression式Excelinput

好吧,所以我现在要做的是从Excelinput(所有string列)中获取所有的信息,然后在这些列中我想为其中的一个创build特定的filter,在列NO_BIEN上更具体具体expression。 [0-9] +([0-9] [0-9])? 我做了一个Filter Rows操作,然后单击REGEXPfilter,但是我看不到粘贴expression式的地方,因为我可以看到是否添加一个String。

从当前行向后查找第一个非空值扫描行

软件 我正在使用Pentaho数据集成5.4 input数据和说明 从文件input数据(简化,有更多的列): number name 1009 ProductA 2150 ProductB 3235 ProductC ProductD ProductE 1234 ProductF 7765 ProductG 4566 ProductH ProductI 9907 ProductJ 问题是,我有一个Excel文件格式的xlsx ,其中包含合并单元格的数据,对于一个id值,有1..n行值。 尽pipe没有合并一列(参见示例id=3 , id=6 ),但是将该文件转换为下一行(除第一个以外)的csv值后仍然丢失。 我使用步骤Add sequence生成一个sequence ,input按原始存储在文件中的方式sorting。 实现目标的步骤 基本上我需要做的是: 查找sequence_number小于current_row.sequence_number第一个非null值 将字段name的值连接到匹配的行 继续扫描sequence_number高于上次扫描的下一行 如前所述,这种情况下可能有1..n行值。 预期产出 number name 1009 ProductA 2150 ProductB 3235 ProductC; ProductD; ProductE 1234 ProductF 7765 ProductG 4566 ProductH; […]