金山云大数据云平台(DataCloud)数据集成是一套稳定高效、弹性伸缩的数据接入、转换、加工、检核的可视化的数据 ETL 套件,整个套件包括数据同步、数据加工、数据整合和业务检核四大功能。极大的降低了用户数据上云以及数据开发的门槛数据集成主要包括四大功能组件:
数据同步工具不仅能够满足传统数据集成服务在复杂网络环境下进行多种异构数据源的导入导出需求,同时在数据导入导出的过程中同步进行数据清洗、去重、规范化等,提高数据质量,防止脏数据、垃圾数据的传播。
数据加工工具采用可视化拖拽的方式进行数据 ETL 开发,降低开发门槛,使没有 SQL 经验的业务人员也能够进行快速的数据逻辑开发。
数据整合工具结合行业经验,沉淀丰富的贴源数据处理算法,用户只需要创建特定的表结构后通过向导式的勾选就可实现数据贴源层加工。
业务检核工具与数据质量模块相结合,对数据进行数据质量,数据波动等进行统计查询,让用户了解数据质量情况。
数据集成是大数据云服务核心组件之一,定位于为大数据云项目中有离线数据的处理,包括用户线下数据的上云迁移,可视化的 ETL 加工,已经数据同步中的检核等。是离线数据处理功能组件的一个重要部分。
文档内容是否对您有帮助?
评价建议不能为空
非常感谢您的反馈,我们会继续努力做到更好!