Tag: etl

SSIS合并join的结果

我有两个数据源 – 文档和客户,我想join他们,创build行,这些信息都来自文档和客户,以customer_code为关键。 最后,我预期的30k结果中只有58个。 缺陷在哪里?

如何使用SSIS加载Excel中的特定字段

我有一个2工作表的Excel工作簿: testdata1和testdata2 。 一张纸的数据如下所示: 正如你所看到的,像average Test和sortnumber一些列标题不在同一行与其他列标题( testvalue1 , testvalue2 ..) 我想将表testdata1和testdata2的数据加载到SQL Server中的表中。 预期产出 我希望看到的结果是这样的 你能帮我怎么做吗? excel数据链接

用于txt或excel的自定义映射工具

我有一个excel dokument(tab分隔)。 每次我可以在我的程序中插入excel之前,我需要将客户端列名映射到我的应用程序中。 所以在我开始开发一个映射工具之前 – 如果已经存在的话会更好。 但是,我不知道我没有find它。 这个工具实际上会读取一个excel或txt文件,允许我命名右侧新列的所有名称并拖放(例如)。 也许这个工具有一个XML或什么东西,我可以定义我的自定义列,然后它会显示在右侧的操作。 我希望你知道我的意思,而且有人也有这个需要。 谢谢 信息更新 我想提一些事情作为我的问题的更新,如果它不迟到:我有大约50个标题/列(例如:名字,中间名,Street1,Street2,..)。 所以每当客户给我他的excel文件(联系人备份)时,我总是需要做的是手动将他的每一列的数据复制到我的一侧。 问题是,每个客户端都有不同的列名,而且客户端的一些列可以列在我的多列上。 所以我想,如果我找不到解决scheme,我会做一个C ++ / QT应用程序,它需要一个excell,并让我分配(拖动,等..)他的每一列到我的列或更多列侧。 我没有做任何vb编程,所以如果你可以更详细的解决如何解决我的vb这将是伟大的。

将从Excel导出的非规范化关系数据导入到SQL Server中

我需要从Excel电子表格导入数据到SQL Server,但数据不是关系/标准格式,所以导入向导不会削减它(据我所知)。 数据的格式如下: Category SubCategory Name Description Category#1 SubCategory#1 Product#1 Description#1 Category#1 SubCategory#1 Product#2 Description#2 Category#1 SubCategory#2 Product#3 Description#3 Category#1 SubCategory#2 Product#4 Description#4 Category#2 SubCategory#3 Product#5 Description#5 (道歉我缺乏创造力,在这个早晨的时候拿出“真实”的数据…) 每行包含一个独特的产品,但cateogry结构是重复的。 我想将这些数据导入到三个表中: Category SubCategory Product (我知道SubCategory应该真的被包含在Category中,DB不是我的devise) 我需要一种方法来导入基于Category和SubCategory列的唯一行,然后在将其他列导入Product时,根据名称获取对SubCategory的引用。 没有脚本编写这个,有没有办法使用导入向导或其他工具来做到这一点?

SSIS导入Exceldate错误(截断错误)

我很抱歉发表看起来很简单的问题,但我找不到答案,而且我正在浪费时间(而不是几个小时)。 我对SSIS相当陌生,它只是踢我的背后。 背景: 非常简单的SSIS包可以将Excel工作表导入到SQL Server中的登台表中。 由于我不想通过使用错误的术语来误导任何人,因此我会将Excel源和EXCEL表作为目标表。 这个软件包曾经工作过。 但是,由于date列的数据截断,它现在失败。 Excel列已被格式化为DATE(在DATE中我已经尝试了几种不同的格式选项)。 目标列也是DATE列(不是date时间)。 Excel中的数据主要是空的单元格,有一些零星的值。 我认为这些错误是从数据中出现的date(而不是空白)开始的。 我曾尝试使用高级编辑器双方(Excel和目标),并尝试了无数的数据types设置,但我一直得到同样的失败。 我怀疑现在已经搞糟了我所做的各种testing。 我也试着为date字段“date [DT_DATE]”添加一个数据转换转换 – 这是行不通的。 而且,我已经尝试创build派生列 – 首先基于Excel列,然后在Transformed列。 所有这些尝试都失败了。 问题: 1)将Excel数据导入到DATE列的SQL Server的最佳做法是什么? 2)由于这是两个非常成熟的微软应用程序(Excel和SQL Server)一起工作,似乎应该是简单的。 这使我相信,我必须在这里错过一些基本概念。 任何人都可以设置我吗? 3)你们如何获得一个Exceldate到SQL Server? 4)编辑后同步列的技巧是什么? 感谢您提供的任何见解。 对不起,打扰你看起来很简单。 大卫

如何parsing存储在MS SQL 2005 varbinary中的excel(.xls)文件?

问题 如何最好的parsing/访问/提取“SQL文件”数据存储为一个SQL 2005字段中的二进制数据? (所有的数据最终都可以存储在其他表的其他字段中)。 背景 基本上,我们的客户需要大量来自用户的详细数据。 不幸的是,我们的客户不能要求从他们的用户的任何种类的数据库导出。 所以我们的客户必须为用户提供某种用户界面来input数据。 我们的客户决定的用户界面可以被所有的用户接受,因为它具有相当强大的用户界面。 所有这一切,我们的客户需要parsing这些数据,并自动存储在他们的数据库。 我们试图说服我们的客户,用户将这样做一次,然后坚持数据库导出! 但客户不能要求数据库导出他们的用户。 我们的客户要求我们parsing一个excel文件 客户的用户正在使用excel作为“最佳”用户界面来input所有需要的数据 用户被赋予空白的Excel模板,他们必须填写 这些模板具有固定数量的唯一命名的选项卡 这些模板有一些必须完成的固定区域(单元) 这些模板也有一些区域,用户将插入多达数千个相同格式的行 完成后,Excel文件通过标准的HTMLfile upload从用户提交 我们的客户将这个文件原始存储到他们的SQL数据库 特定 一个标准的excel(“.xls”)文件(本地格式,不是逗号或制表符分隔) 文件原始存储在varbinary(max) SQL 2005字段中 excel文件数据在行之间可能不一定是“一致的”,也就是说,我们不能假设一列是完全相同的数据types(例如,可能有行标题,列标题,空单元格,不同的“格式”), …) 要求 代码完全在SQL 2005(存储过程,SSIS?) 能够访问任何工作表上的值(选项卡) 能够访问任何单元格中的值(不需要公式数据或取消引用) 不能假定单元格的值在行之间是“一致的”,也就是说,我们不能假设一列是完全相同的数据types(例如,可能有行标题,列标题,空单元格,公式,不同的“格式“,…) 优先 没有文件系统访问(不写入临时.xls文件) 以定义的格式检索值(例如,实际date值而不是像39876那样的原始数字)

使用Excel进行数据提取

我每月会收到100+的excel电子表格,我需要一个固定的范围,并粘贴到其他电子表格中来做报告。 我试图写一个VBA脚本来迭代我的Excel文件,并复制范围在一个电子表格,但我还没有能够做到这一点。 是否有捷径可寻?

使用Interop从Excel中获取最后一个非空列和行索引

我试图从使用Interop库的Excel文件中删除所有多余的空行和列。 我跟着这个问题最快的方法来删除空行和列从Excel文件使用互操作 ,我觉得很有帮助。 但我有Excel文件包含一小部分的数据,但很多空行和列(从最后一个非空行(或列)到工作表的结尾) 我试着循环遍历行和列,但循环需要几个小时。 我想获得最后一个非空的行和列索引,所以我可以删除一行中的整个空范围 XlWks.Range("…").EntireRow.Delete(xlShiftUp) 注意:我试图让包含数据的最后一行删除所有额外的空白(在这一行或列之后) 有什么build议么?

将Excel电子表格列导入到SQL Server数据库中

我有一个Excel电子表格,我想导入select列到我的SQL Server 2008数据库表。 该向导没有提供该选项。 有没有简单的代码选项存在?