SSIS(SQL Server Integration Service)是Microsoft 从SQL Server2005 以后发布的,现在一直跟随每个SQL server版本。它是Microsoft BI 解决方案的一大利器,我们一般认为SSIS就是ETL(Extract Transform Load)工具,一般用来导入数据到数据库。SSIS比普通的ETL更进一步,它是可视化的,用Visual Studio来开发,包文件(*.dtsx)采用的是XML格式。
SSIS提供控制流和数据流。控制流也称为工作流或者任务流,它更像工作流,在工作流中每个组件都是一个任务。这些任务是按预定义的顺序执行的。在任务流中可能有分支。当前任务的执行结果决定沿哪条分支前进。
数据流是新的概念。数据流也称为流水线,主要解决数据转换的问题。数据流由一组预定义的转换操作组成。数据流的起点通常是数据源(源表);数据流的终点通常是数据的目的地(目标表)。可以将数据流的执行认为是一个流水线的过程,在该过程中,每一行数据都是装配线中需要处理的零件,而每一个转换都是装配线中的处理单元。
SSIS 可以性能卓越的提供以下功能
- 从几乎任何数据源中检索数据
- 对数据执行不同的转换; 例如从一种类型转换为另一种类型,转换为大写或小写,执行计算等。
- 将数据加载到几乎所有的源
- 定义工作流
SSIS 的体系结构主要由四部分组成:Integration Services 服务、Integration Services 对象模型、Integration Services 运行时和运行时可执行文件以及封装数据流引擎和数据流组件的数据流任务(如图):
在后面的入门系列文章里将会阐述以下模块
1. SSIS向导/设计器(开发环境以及工具)
2. 任务流
3. 数据流
4. 连接管理器以及数据源
5. 事件处理
6. 日志处理
7. 配置管理
8. 自定义模板以及组件
9. 包的执行以及调试