前言
SSIS(SQL Server Integration Services)是一个较低成本的ETL工具,因此在很多地方都有应用。相对来说介质容易获取,也较易上手,很多人都会选择自学,很多团队也会有针对性的工具培训。
在这里,整理一下SSIS知识体系的几个要点,可以作为自学者循序渐进的一个参考,也可以作为SSIS初级培训讲师的提纲。
预先准备工作
微软的联机帮助是学习SSIS最好的教程,因此 ,可以作为案头手册时刻翻查。
联机帮助中也提供了SSIS的教程,这应该算作是官方教程了,在【文档和教程】->【SQL Server教程】下可以找到。
此教程分为两个部分,分别是:
1、 设计和实现包;用官方Step by Step的实例介绍了:
1)创建项目/创建包
2)基本控制流和数据流组件,介绍了诸如循环容器、数据源组件、错误流、包配置等基本开发技术点。
2、部署包;介绍了如何将设计开发好的包部署至目标服务器;
整个教程大约5小时可以完成,练习之后,可以学会基本的创建包开发包部署包的步骤。
要完成官方教程中的例子,需要在本地恢复两个样例数据库,分别是 AdventureWorksDW和AdventureWorks2008R2(针对SQL Server 2008R2)。
SSIS知识体系梳理
将SSIS相关的知识点做了一个梳理,可作为SSIS培训的大纲,往后将持续补充。如为培训,则可以顺序推进。
1.产品介绍
介绍ETL工具SSIS,SSIS的功能,在微软BI解决方案框架中的定位;
2.介绍BIDS
熟悉Business Intelligence Development Studio, 开发界面。
3.体系架构介绍
结合Integration Services架构图,了解前后台的各种工具、运行时环境以及服务等。
4.概念解释
此部分介绍部分概念以及名词,剩余部分将在后续开发过程介绍中穿插。
1) 包和包的组成;
2) 连接管理器;
3) 控制流、控制流元素、控制流常用组件;
4) 数据流、数据流元素、数据流常用组件;
5.开发过程相关
通过实操开发过程样例和练习,掌握开发过程相关重要步骤,补充完善概念及理论知识。
1)项目的创建,介绍项目组成
2)数据源和数据源视图
3)SSIS包设计开发
(1)构建控制流,了解控制流各主要组件
(2)构建数据流,了解数据流各主要组件
4)调试包,了解断点、数据查看器等调试方式;
5)执行包,掌握dtexec等各种执行方式;
6)事件处理介绍,大致了解SSIS的事件处理机制;
7) 日志记录管理器,掌握日志记录各种方式;
8)配置及部署包,熟悉配置文件、掌握包部署、包安装以及JOB的编辑。
9)通过SSMS管理和监控包
6.理论回顾
再次回顾架构,结合部分SSIS机制原理。如SSIS运行时环境以及数据流引擎。