这些众多的BI项目从规模和对BI系统支撑的完善程度上来说,大体可以分为Framework、Stand-alone Tools和BI Suit三种类型。
- Framework
开源框架,这是在商业BI系统中所没有的。我们可以使用它们来构建自己的BI工具,或者增强和扩展我们的BI解决方案。
- Stand-alone Tools
独立的BI工具,这是开源项目中数量最多的一类。很多工具只侧重BI系统中的某个环节和方面,如ETL、Report、OLAP和Database等等。
- BI Suit
在统一的架构下提供了多种BI系统的特性的工具集合。就目前的情况看,不管是商业软件还是开源软件,还没有任何一个套件提供了完整的端到端的BI解决方案。这些开源的BI Suit是通过连接多个其他的组件和工具的方式形成套件的,由于BI系统涉及到的工具是非常多的,所以整合一套完整的BI解决方案是很困难的。
BI解决方案中的工具
一个完整的BI解决方案中有多种工具来完成BI系统中各个阶段的工作。
ETL工具
数据抽取、转换和加载工具。优秀的ETL工具应该具有以下特性:
- 1、 Workflow Management, Job Execution and Scheduling Manager。能方便地定义流程并自动化执行ETL任务。
- 2、 Centralized Metadata Repository and Management。集中存储和管理符合业界标准的元数据。
- 3、 Data Profile and Validation。可以检验数据的质量。
- 4、 High Performance。在大负荷的任务执行中仍然有良好的性能。
- 5、 Scalable, Platform Independent。具有良好的弹性,支持多种操作系统和数据库系统,能操作多种异构的数据源。
- 6、 Open Architecture and API。具有开放的架构和易于使用的二次开发接口。
目前较为知名的开源ETL工具有:
- 1、 KETL,由具有IBM和KPMG背景的Kinetic Networks公司开发,现在已经有三年多的产品应用历史,成功应用于一些产品中,在点击流(ClickStream)分析应用中表现出色。KETL采用Plug-in的架构,使用Java开发。
- 2、 KETTLE,为一个元数据驱动的ETL工具。已经加入Pentaho。
- 3、 Clover ETL,为一个基于Java的ETL Framework,可以用来开发自己的ETL应用。
- 4、 Enhydra Octopus,为一个基于Java的ETL工具,使用JDBC来连接各种数据源,易于使用和部署。曾有人应用于电信网络资源分析系统中。
报表工具
优秀的报表工具通常具有以下特性:
- 1、 支持多种数据源。
- 2、 直观的可视化设计器,简单易用的报表定制功能。
- 3、 方便的数据访问和格式化,丰富的数据呈现方式。
- 4、 符合数据呈现的通用标准,能和应用程序很好地进行结合。
- 5、 易于扩展和部署。

