kettle是个开源的ETL工具,能将多种形式的数据源数据抓取到数据库中。
将Excel文件中的数据导入数据库。
1.创建一个转换,单击文件->文件->转换。
2.从输入菜单中选择Excel输入。
3.配置要导入的 Excel文件,点击浏览选择文件。
如果想读取文件夹下以.xls为后缀的文件,kettle支持正则表达式,在规则表达式中写入正则表达式^.+\.xls$。点击“增加”,增加文件或目录和规则表达式。
可以单击“显示文件名称”测试正则表达式是否正确。
4.配置sheet页名称,选择“工作表”Tab页,点击"获取获取工作表名称",在可用项目中选择sheet页名称。
5.配置文件中导入字段。选择“字段”Tab页,点击“获取来自头部数据字段”。
6.配置导入的数据库 ,在输出菜单中选择表输出。配置数据源和要输出的表名。如果没有数据库连接可点击“新建”,配置对应数据库的连接,注:在使用JDBC时,需要对应的驱动包。
7.配置文件与表之间的映射关系。在“表输出”中选择“database fields”,点击“enter field mapping”,选择mapping关系。
Excel文件中的数据导入数据库的配置已经完成。点击运行。
可将作业与转换整合,定时扫描文件夹将Excel文件中的数据导入数据库。
1.创建一个作业,单击文件->文件->作业。
2.在“通用”菜单中选择START,配置作业的时间以及间隔时间。
3.在“通用”菜单中选择Transformation,配置转换。
4.在“通用”菜单中选择Success。
作业已经与转换关联起来,根据设置的时间会定时执行作业。点击“运行“。
转载于:https://blog.51cto.com/lizhengyang/1324485