Tag: pentaho

在Pentaho的Switch / Case步骤中为每个案例生成一个Excel输出文件步骤

我有一个文本文件input步骤,从同一目录下的几个文件读取,并产生一个巨大的数据集。 我需要为Switch / Case语句中的每个案例生成一个excel文件输出,并根据数据集中某个字段的值为每个 excel文件命名。 这是可能的勺子? 任何帮助将不胜感激。

Pentaho Filter正则expression式Excelinput

好吧,所以我现在要做的是从Excelinput(所有string列)中获取所有的信息,然后在这些列中我想为其中的一个创build特定的filter,在列NO_BIEN上更具体具体expression。 [0-9] +([0-9] [0-9])? 我做了一个Filter Rows操作,然后单击REGEXPfilter,但是我看不到粘贴expression式的地方,因为我可以看到是否添加一个String。

Excel到一个数据库输出中的多个表 – PDI

我正在使用Pentaho数据集成为我的ETL过程…我有多个Excel文件,我需要合并和上传在一个数据库中。 但是,我不能将这些字段分配到数据库中相应的表中。 我只能一次把它发送到一张桌子上。 有没有其他方法可以做到这一点? 我怎么能有多个目标表? PS我正在使用MySQL Workbench的数据库。 感谢您的帮助!

第一列中的空值是否阻止在Pentaho Spoon中导入Excel文件?

我正尝试使用Pentaho Kettle / Spoon中的“Excelinput”转换来导入Excel文件。 勺子为第67行(第一列中有一个空值)吐出一个'NullPointerException'。 (前66列在第一列中有非空值。) 这里是错误日志: 2011/07/19 15:07:17 – Excel Input.0 – ERROR (version 4.1.0-stable, build 14410 from 2010-11-16 16.43.28 by buildguy) : Error processing row from Excel file [D:\Documents and Settings\kdrapkin\Desktop\Dataset creation\PDA data Saudi Arabia\input files\100 w.xlsx] : java.lang.NullPointerException 2011/07/19 15:07:17 – Excel Input.0 – ERROR (version 4.1.0-stable, build 14410 from 2010-11-16 16.43.28 […]

Pentaho Max尝试从xaction输出excel时的列宽度错误

我设法使用3个pentaho工具为我的数据库build立了一个成功的工作环境。 水壶转换:从JNDI查询。 一个pentaho报告:它组织和输出转换给出的数据。 pipe理参数并将在线报表解决scheme的Action Secuence xaction。 一切似乎工作正常,一旦我把网上我的报告,我在参数中input一些input,然后提交几乎任何报告格式的forms:文本/ HTML,PDF和CVS。 但是,当我尝试提交一个Excel输出(应用程序/ vnd.ms-excel)时,我得到以下错误: Pentaho BI平台在运行动作序列时报告了错误 可能的原因:RuntimeContext.ERROR_0017 – [es_18]活动未能执行操作顺序:BillingReport.xaction执行堆栈:EXECUTING操作:Pentaho Report(SimpleReportingComponent)循环索引(基于1):0错误时间:2012年4月5日12H18 'VET错误types:ActionExecutionException会话ID:joe实例ID:65ad1224-f779-11e1-a34f-b53c1ce91064操作类:SimpleReportingComponent操作描述:Pentaho报告 即使在.prpt文件中没有任何字段,它仍然显示相同的错误(我也使用pipe理控制台刷新了每次更改后使用的biserver)。 如果我检查catalina.out日志中发生了什么,我会得到一堆javaexception跟踪,但是有一行显示: java.lang.IllegalArgumentException:单个单元格的最大列宽度为255个字符。 我不知道,但它看起来像一个叫做setColumnWidth的与apache / tomcat函数相关的jira问题。 有任何想法吗?

pentaho修改并输出excel时输出参数

我使用pentaho报告devise器。 我的prpt文件中有businessdate参数。 这有用于过滤SQL查询的date范围的值。 我能够处理和修改,而出口到HTML,但我有出口到Excel中的问题。 date范围的格式如下: – BETWEEN {d '2014-01-01'} AND {d '2014-01-31'} – IN ({d '2014-01-14'},{d '2014-01-15'}, {d '2014-01-19'} ,{d '2014-01-20'},{d '2014-01-21'}) 我喜欢找出最大和最小date并显示它。 然而,在这种情况下与Excel中,我很高兴显示它们用逗号分隔,如下所示。 – 2014-01-01, 2014-01-31 – 2014-01-14, 2014-01-15, 2014-01-19, 2014-01-20, 2014-01-21 如果我使用下面的基本公式显示,它可以在Excel中运行,但在将它应用于pentaho报表devise器中的businessDate元素的Excelexpression式部分时,它不起作用。 =TRIM(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(B4,"{d '",""), "BETWEEN", ""), "IN", ""),"'}",", "), " AND ", ""),")",""),"(",)) 它不一定是这样的。 我很高兴与任何方法build议格式化这个原始的date范围之前打印到Excel。 先谢谢你。

Pentaho,多input多input

我一直想弄清楚如何设置Pentaho为作业的每个input写不同的文件。 我的转换将很快能够从FTP获取.txt文件,数量可变的文件,我现在正在进行转换的方式,无论从文件夹(FTP或本地)获得的文件数量是多less,它都会生成一个大的XLS输出,输出端的信息都是正确的,它们都与我想精确提取的数据相匹配,但是为了组织这些文件,我需要pentaho从一个input创build一个文件。 如果要创build文件(//PentahoIn0001.txt,//PentahoIn0002.txt,//PentahoIn0003.txt),我想要现在它只是创build一个具有所有三个input的数据值的单个文件。 到目前为止,我已经尝试了几种方式,没有任何结果,甚至包括来自这里和外部的其他几个援助转型和工作,但它根本没有。

ETL – 如何将表标题作为字段值添加到Pentaho Spoon中的每个后续行

我是Pentaho Spoon(水壶)的新手,有以下任务: 有一个excel表,它可能是这样的: history class name first name id Doe John 213 Muster Max 118 biology class name first name id Parker Peter 844 问题是在一个xls文件里有更多的表格。 在这个例子中,有历史课的学生和生物课的学生。 我需要输出的是:每个学生都有一个新领域的所有学生的表格,说明他是哪个class级的一部分。 例: name first name id class Doe John 213 history class Muster Max 118 history class Parker Peter 884 biology class (我的例子极其简单) 如何将input表转换为输出表? 感谢您的帮助!

Pentaho Data Inegration – 多个Excel文件input加载

我一直在使用勺子作为工具来完成一个项目。 其中一个要求是加载多个具有相同格式(表单)的Excel文件,以便将其输出到表格输出。 然而,Excel文件的数量必须是可变的(需求),但它们位于同一个文件夹中。 哪个步骤允许加载文件夹中的所有Excel文件? 谢谢。

通过反向工程deviseExcel电子表格来devise报告

我正在尝试生成最终应以Excel格式导出的报告。 报告的模板在Excel中可用。 有没有一种聪明的方法来“deviseExcel”来devise报告(如果可能的话,考虑细胞的位置)。 我想过导入一个HTML版本的报告,但我想知道是否已经有一个标准的方法来做到这一点,然后开始重新发明轮子。