Tag: etl

在Pentaho的Switch / Case步骤中为每个案例生成一个Excel输出文件步骤

我有一个文本文件input步骤,从同一目录下的几个文件读取,并产生一个巨大的数据集。 我需要为Switch / Case语句中的每个案例生成一个excel文件输出,并根据数据集中某个字段的值为每个 excel文件命名。 这是可能的勺子? 任何帮助将不胜感激。

添加具有相同types数据但列名不同的CSV文件

希望你一切顺利。 我需要一些帮助。 举个例子,我有3个csv文件: 1)具有2个logging/行的File1.csv firstname | lastname | city | country | emailaddress —————————————————– alexf sdfsd mumbai india sdf@sdf.com ———- asfd sdfsdf toronto canada dfsd@sdf.com 2)secondfile.csv有2个logging/行 first-name | last-name | currentcity | currentcountry | email-address ———————————————————————- asdf sdfkjwl sydney australia sdf@dsffwe.com ———- lskjdf sdlfkjlkj delhi india sdflkj@sdf.com 3)用2个logging/行的userfile.csv fname | lname | usercity | usercountry […]

什么是可以由SSIS导入的最大Excel文件大小(以MB为单位)

我想知道最大的Excel文件大小,我们可以使用一个简单的ETL SSIS包加载到数据库。 如果文件大小取决于系统configuration或资源,那么我们如何计算呢? 在我的情况下,我想加载一个500 + Mbs的Excel文件。 即使试图映射列,我的包也会被挂起。 谢谢。

需要比较两个excel文件中的数据

我需要比较两个excel文件。 一个从数据库中提取并保存为CSV。 其他文件是包含当天所有logging的累积报告。 我需要检查累积报告中的所有数据是否在我从数据库中提取的其他csv文件中。 我知道VLOOKUP ,但我不确定VLOOKUP是否可以比较整个文件logging。 许多文件有4到5千条logging,其中有50列。 还有其他的select吗? 任何免费的ETL工具?

从Excel中进行数据转换

我有一些水平和垂直维度的Excel文件中的数据。 它看起来像这样: 这些数据必须加载到一些BI系统中。 为此,我必须将数据转换为“表格样式”。 换句话说,它应该像这样呈现在表格中: 我需要一些有效的algorithm来做这个转换。 我知道的唯一一个就是从第一个单元格(100000)获取值,从垂直和水平坐标(俄罗斯,人口,1900)获得数值并插入第一行。 然后拿另一个单元格等等。 这将是less量的数据工作,但大量的工作非常缓慢。 你知道这种数据更复杂的algorithm吗?

SSIS:“错误:expression式的结果”@ …不能写入属性“

我一直在尝试过去10个小时来解决以下问题: 我有一个ForEach循环容器,枚举我的控制stream中的Excel文件名。 在ForEach循环容器中,我有一个将数据导入到Sql-Server的Excel Source。 这连接到派生列转换使用User :: FileName作为expression式连接到一个OLE DB命令映射到User-FileName到Report_Date(Excel文件名称包含报表date)列在Sql-Server中相关的行。 以下是我的控制stream的片段: 我不断收到以下exception: Error: The result of the expression "@[User::FileName]" on property "\Package\Foreach Loop Container 1\Data Flow Task.Properties[[Derived Column].[Derived Column Output].[Derived Column 2].[FriendlyExpression]]" cannot be written to the property. The expression was evaluated, but cannot be set on the property. 我试过了我所知道的一切,无法摆脱它。 用尽选项。 我错过了在这个过程中的一个步骤?

在SSIS中以编程方式重命名列名称

我有一个Excel文件,必须在SSIS中清理。 其中一个任务是重命名F1,F2的默认值的列名….总共列是95,还有其他如此大的Excel文件。 我正在寻找一种方法来重命名这些列名称。 请看图片。 从拖放菜单更改名称是不方便的,恕我直言,恕我直言

从Excel工作表中提取数据到多个SQL Server表

我有一个Excel文件,有几列(20)和一些数据,我需要上传到4个SQL Server表。 这些表是相关的,特定的列表示每个表的我的ID。 是否有一个ETL工具可以用来自动化这个过程?

SSIS将SQL数据库打包到Excel电子表格目标Unicode错误

我有一个数据库OLE来源去一个Excel目标。 我收到以下错误 数据stream错误[Excel目标[88]]:列“X”不能在Unicode和非Unicodestring数据types之间转换。 我在数据转换中添加了将string列更改为Unicode。 这并没有解决问题。 任何指导将不胜感激

无法使用SSIS将数据从Excel加载到SQL中

我试图用SSIS包导入一个excel文件到SQL服务器,但是每次我尝试上传这个文件时,最后的一些行都没有上传,准确的说55107应该被上传,但是只有54990被上传。 117行正在产生一些问题,我无法弄清楚为什么这样。 请帮我理解这个错误信息,以便我可以解决这个问题。 以下是我收到的错误消息: SSIS包“C:\ Users \ A670814 \ Documents \ Visual Studio 2015 \ Projects \ Integration Services Project1 \ Integration Services Project1 \ NDCS Towers.dtsx”开始。 信息:NDCS塔上的0x4004300A,SSIS.Pipeline:validation阶段开始。 信息:NDCS塔上的0x4004300A,SSIS.Pipeline:validation阶段开始。 警告:0x80049304在NDCS塔,SSIS.Pipeline:警告:无法打开全局共享内存与性能DLL进行通信; 数据stream性能计数器不可用。 要解决此问题,请以pipe理员身份或系统控制台运行此程序包。 信息:NDCS塔上的0x40043006,SSIS.Pipeline:准备执行阶段开始。 信息:NDCS塔上的0x40043007,SSIS.Pipeline:预执行阶段开始。 信息:NDCS塔上的0x4004300C,SSIS.Pipeline:执行阶段开始。 错误:NDCS塔上的0xC0202009,OLE DB目标[280]:SSIS错误代码DTS_E_OLEDBERROR。 发生OLE DB错误。 错误代码:0x80004005。 OLE DBlogging可用。 源:“Microsoft SQL Server本机客户端11.0”Hresult:0x80004005描述:“未指定的错误”。 错误:NDCS塔上的0xC020901C,OLE DB目标[280]:OLE DB Destination.Inputs [OLE DB目标input] .OLP DB Destination.Inputs [OLE […]