多用户协同开发
多租户机制,项目制管理,支持不同角色用户协同开发,支持严格的权限管控和资源隔离,提升大数据项目整体效率和安全性。
多源异构数据集成
- 支持多种异构数据源的批量和实时数据接入
- 支持复杂网络环境(有公网/无公网)下的数据接入
- ETL过程支持脱敏、加密、标准化等企业特性
全链路的数据管理
- 支持查看企业所有数据资产分布情况
- 支持元数据统一管理,库表统一管理
- 支持数据血缘、数据质量、数据生命周期管理
- 支持企业内部数据权限申请与审批
海量数据批量处理
- 支持拖拽式构建任务工作流
- 支持SQL、MR、shell、数据同步等多种处理算子
- 支持异构集群任务调度,支持容器化运行环境
- 支持隔离的测试和生产环境
流式数据实时处理
- 支持拖拽式工作流编辑,支持任务上下游依赖关系编排
- 支持多种流处理算子
- 支持在线编写业务逻辑SQL
- 支持流数据运维,实时展现数据指标
多数据源统一查询
- 统一SQL查询Hadoop、GreenPlum、ES、关系库等异构数据系统;
- 提供标准的分析接口;
- 适用于企业存在多种数据存储系统需要统一提供标准化分析接口的场景。
多维数据分析与可视化
- 支持海量数据毫秒级查询
- 支持丰富的可视化展现形式
- 支持灵活构建分析主题仪表板
- 支持大屏设计与实时动态刷新
大规模作业智能调度
- 支持每天百万级任务调度;
- 单个工作流支持千个以上任务
- 分钟级作业流定时调度,秒级节点间调度延迟
- 支持异构集群作业调度,支持非Yarn类工作流容器化调度