当前位置: 首页 > news >正文

kettle插件-kettle数据清洗插件,轻松处理脏数据

前面我们已经介绍了很多kettle插件,每个kettle插件都它的使用场景,我们在做数据同步ETL的过程中,势必要处理一些脏数据,把数据质量提高。今天我们一起来学习这这款数据清洗插件。

1、转换设计

1)生成记录 模拟数据输入

2)数据清洗 选择具体的数据清洗规则对数据进行清洗

3)写日志 输出清洗前和清洗后的数据

8125eb43-3fce-42f6-abed-1e65f707ffeb

 2、生成记录

简单填写三个字段,id,engName,chnName,如下图所示

a2f0457e-34c7-4ea4-b065-8038913a88a3

 3、清洗插件设置

1)选择待清洗的插件

2)设置规则

3)根据需求填写输出字段名

从图中可以看到,这里预设了20多个常用的清洗规则,根据需求自行选择,不满足需求,可以进行扩展。

截屏2025-09-14 22.07.57

 4、保存&运行

保存转换文件,点击运行按钮,运行正常。

1)id 字段,规则不做任何操作,原样输出。

2)engName=xiaojigang,规则单词首字母大写,输出Xiaojingang。

3)chnName=小金刚,规则汉子转手拼,输出XJG。

 

写在最后

今天,我们团队已经研发了将近100+款插件,360度无死角覆盖常见的业务场景,朋友们,老铁们,你们还缺什么功能的kettle插件,欢迎评论区留言探讨。

 

http://www.hskmm.com/?act=detail&tid=10732

相关文章:

  • 中二
  • web应用程详解part1
  • Seedream 4.0 简直绝了!
  • 财务管理NPV与IRR投资分析在IT行业案例
  • 优化sigmoid
  • mysql查询死锁,mysql查询死锁方法
  • 【IEEE出版、已连续5届稳定快速EI检索】第六届计算机工程与智能控制学术会议(ICCEIC 2025)
  • 软工第二次作业之个人项目——论文查重
  • 对实体类Id自增
  • HarmonyOS之UIContext 与 UIAbility、WindowStage 的关系 - 指南
  • 向上一步——当做事纠结的人停止决策内耗,你就是掌控自己的神!
  • Windows平台安装cocos2d-x V3.17.2
  • 完整教程:Mistral Document AI已正式登陆Azure AI Foundry(国际版)
  • 飞书机器人推送消息通知用自定义机器人
  • ENSP 常用命令
  • Kubernetes权威指南-基础篇
  • 【IEEE出版、已连续6届EI稳定检索】第七届机器学习、大数据与商务智能国际会议 (MLBDBI 2025)
  • office2024安装教程(附安装包)Office 2024 专业增强版下载安装激活详细图文步骤
  • Gitflow 工作流程
  • 魔改chromium真正通杀全网debugger检测
  • C#依赖注入
  • 完整教程:Docker Compose 一键启动多容器服务
  • 【截稿倒计时、高录用、稳检索】2025年教育创新与信息技术国际学术会议(EIIT 2025)
  • 低代码 + AI 构建智慧校园系统:某高校宿舍报修平台的48小时构建全流程
  • [MCP][07]logging和progress等功能说明
  • 端口命令
  • Microsoft OLE漏洞致远程代码执行安全公告解析
  • 写代码还是写提示词?——Prompt 工程是不是程序员的新技能树
  • c-store发送dcm文件超时
  • 解码C语言模块化编程