我有一个文本文件input步骤,从同一目录下的几个文件读取,并产生一个巨大的数据集。 我需要为Switch / Case语句中的每个案例生成一个excel文件输出,并根据数据集中某个字段的值为每个 excel文件命名。 这是可能的勺子? 任何帮助将不胜感激。
好吧,所以我现在要做的是从Excelinput(所有string列)中获取所有的信息,然后在这些列中我想为其中的一个创build特定的filter,在列NO_BIEN上更具体具体expression。 [0-9] +([0-9] [0-9])? 我做了一个Filter Rows操作,然后单击REGEXPfilter,但是我看不到粘贴expression式的地方,因为我可以看到是否添加一个String。
我正在使用Pentaho数据集成为我的ETL过程…我有多个Excel文件,我需要合并和上传在一个数据库中。 但是,我不能将这些字段分配到数据库中相应的表中。 我只能一次把它发送到一张桌子上。 有没有其他方法可以做到这一点? 我怎么能有多个目标表? PS我正在使用MySQL Workbench的数据库。 感谢您的帮助!
我正尝试使用Pentaho Kettle / Spoon中的“Excelinput”转换来导入Excel文件。 勺子为第67行(第一列中有一个空值)吐出一个'NullPointerException'。 (前66列在第一列中有非空值。) 这里是错误日志: 2011/07/19 15:07:17 – Excel Input.0 – ERROR (version 4.1.0-stable, build 14410 from 2010-11-16 16.43.28 by buildguy) : Error processing row from Excel file [D:\Documents and Settings\kdrapkin\Desktop\Dataset creation\PDA data Saudi Arabia\input files\100 w.xlsx] : java.lang.NullPointerException 2011/07/19 15:07:17 – Excel Input.0 – ERROR (version 4.1.0-stable, build 14410 from 2010-11-16 16.43.28 […]
我设法使用3个pentaho工具为我的数据库build立了一个成功的工作环境。 水壶转换:从JNDI查询。 一个pentaho报告:它组织和输出转换给出的数据。 pipe理参数并将在线报表解决scheme的Action Secuence xaction。 一切似乎工作正常,一旦我把网上我的报告,我在参数中input一些input,然后提交几乎任何报告格式的forms:文本/ HTML,PDF和CVS。 但是,当我尝试提交一个Excel输出(应用程序/ vnd.ms-excel)时,我得到以下错误: Pentaho BI平台在运行动作序列时报告了错误 可能的原因:RuntimeContext.ERROR_0017 – [es_18]活动未能执行操作顺序:BillingReport.xaction执行堆栈:EXECUTING操作:Pentaho Report(SimpleReportingComponent)循环索引(基于1):0错误时间:2012年4月5日12H18 'VET错误types:ActionExecutionException会话ID:joe实例ID:65ad1224-f779-11e1-a34f-b53c1ce91064操作类:SimpleReportingComponent操作描述:Pentaho报告 即使在.prpt文件中没有任何字段,它仍然显示相同的错误(我也使用pipe理控制台刷新了每次更改后使用的biserver)。 如果我检查catalina.out日志中发生了什么,我会得到一堆javaexception跟踪,但是有一行显示: java.lang.IllegalArgumentException:单个单元格的最大列宽度为255个字符。 我不知道,但它看起来像一个叫做setColumnWidth的与apache / tomcat函数相关的jira问题。 有任何想法吗?
我使用pentaho报告devise器。 我的prpt文件中有businessdate参数。 这有用于过滤SQL查询的date范围的值。 我能够处理和修改,而出口到HTML,但我有出口到Excel中的问题。 date范围的格式如下: – BETWEEN {d '2014-01-01'} AND {d '2014-01-31'} – IN ({d '2014-01-14'},{d '2014-01-15'}, {d '2014-01-19'} ,{d '2014-01-20'},{d '2014-01-21'}) 我喜欢找出最大和最小date并显示它。 然而,在这种情况下与Excel中,我很高兴显示它们用逗号分隔,如下所示。 – 2014-01-01, 2014-01-31 – 2014-01-14, 2014-01-15, 2014-01-19, 2014-01-20, 2014-01-21 如果我使用下面的基本公式显示,它可以在Excel中运行,但在将它应用于pentaho报表devise器中的businessDate元素的Excelexpression式部分时,它不起作用。 =TRIM(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(B4,"{d '",""), "BETWEEN", ""), "IN", ""),"'}",", "), " AND ", ""),")",""),"(",)) 它不一定是这样的。 我很高兴与任何方法build议格式化这个原始的date范围之前打印到Excel。 先谢谢你。
我一直想弄清楚如何设置Pentaho为作业的每个input写不同的文件。 我的转换将很快能够从FTP获取.txt文件,数量可变的文件,我现在正在进行转换的方式,无论从文件夹(FTP或本地)获得的文件数量是多less,它都会生成一个大的XLS输出,输出端的信息都是正确的,它们都与我想精确提取的数据相匹配,但是为了组织这些文件,我需要pentaho从一个input创build一个文件。 如果要创build文件(//PentahoIn0001.txt,//PentahoIn0002.txt,//PentahoIn0003.txt),我想要现在它只是创build一个具有所有三个input的数据值的单个文件。 到目前为止,我已经尝试了几种方式,没有任何结果,甚至包括来自这里和外部的其他几个援助转型和工作,但它根本没有。
我是Pentaho Spoon(水壶)的新手,有以下任务: 有一个excel表,它可能是这样的: history class name first name id Doe John 213 Muster Max 118 biology class name first name id Parker Peter 844 问题是在一个xls文件里有更多的表格。 在这个例子中,有历史课的学生和生物课的学生。 我需要输出的是:每个学生都有一个新领域的所有学生的表格,说明他是哪个class级的一部分。 例: name first name id class Doe John 213 history class Muster Max 118 history class Parker Peter 884 biology class (我的例子极其简单) 如何将input表转换为输出表? 感谢您的帮助!
我一直在使用勺子作为工具来完成一个项目。 其中一个要求是加载多个具有相同格式(表单)的Excel文件,以便将其输出到表格输出。 然而,Excel文件的数量必须是可变的(需求),但它们位于同一个文件夹中。 哪个步骤允许加载文件夹中的所有Excel文件? 谢谢。
我正在尝试生成最终应以Excel格式导出的报告。 报告的模板在Excel中可用。 有没有一种聪明的方法来“deviseExcel”来devise报告(如果可能的话,考虑细胞的位置)。 我想过导入一个HTML版本的报告,但我想知道是否已经有一个标准的方法来做到这一点,然后开始重新发明轮子。