前言

在大型的数据仓库、数据分析类的项目里,由于数据孤岛、数据质量等问题,数据处理(ETL)工作比较繁重,往往占项目一半或以上的时间,因此是否有一个稳定的、易用的、高性能、可扩展的ETL工具,影响到项目的成败。在 ETL 工具选型中,Informaca,Datastage 等商业软件是主要的备选产品,但这些软件采购运维成本高,扩展不灵活导致整体项目成本高,而Kettle 的出现让项目实施多了一个选择。

Kettle 是一款开源的ETL工具,从开源(2004年)到现在(2019年)已经有15年时间了,这15年时间里,Kettle 被越来越多的数据库、数据仓库从业者所了解和使用。在数据仓库类项目中,发挥着越来越大的作用。另外国内也有一些公司在 Kettle 开源版的基础上,改进Kettle 的功能,发布Kettle 插件或各类数据平台。无论是原生的 Kettle 还是其他各种基于Kettle 的发布版本,有效降低了企业数据仓库的建设成本,增强了企业对底层软件的自主可控能力。

北京傲飞商智软件有限公司从Kettle 的第一个开源版本就开始参与 Kettle 的开发工作,同时为国内企业提供 Kettle 的定制开发服务,使之适合国内的应用环境。也见证了 Kettle 从一个小工具软件到电信、电力、医疗、金融等各行业的应用过程。尤其近两年 Kettle 已经在银行等金融行业开始应用,说明 Kettle 已经逐渐成熟,可以和Datastage、Informatica 等商业ETL软件媲美。

为了方便开发人员使用 Kettle 软件,以及基于Kettle的傲飞数据管理平台,我们整理了这个在线帮助文档。如果您对本帮助文档的任何意见和建议,请和我们联系:support@pentahochina.com

Last updated