大数据云平台(Cubricks)是金山云在智能数字化转型时代推出的新一代大数据智能产品。在主流Hadoop、Spark框架之上构建端到端的大数据智能开发管理闭环,以高度统一的标准提供数据汇聚、数据开发、智能调度、数据管理、数据分析与服务等一站式大数据Web化处理环境,帮助您轻松挖掘数据价值,助力企业数字化运营。
- CU
大数据平台计算单元。CU描述了作业的最小运行能力,作业可跑在多个CU上运行。
- DCU
容器计算单元。DCU描述了作业的最小运行能力,作业可跑在多个DCU上运行。
- 资源组
购买的CU/DCU资源可按组进行管理,划分多个资源组,每个资源组按业务量任意分配不同的CU/DCU数。如购买了30个CU,可划分2个资源组,分别分配10CU和20CU。
- 项目
项目是大数据云平台最基本的业务组织单元,主账号可以根据不同的项目需求创建多个项目,每个项目包含不同的大数据云组件,如项目1包含数据采集和流计算组件,项目2包含数据集成和批计算组件。项目管理员可以将不同的人加入到不同的项目中,实现多人协作开发,项目制管理。
- 任务
数据处理逻辑的封装,如数据同步任务完成数据从源库到目的库的数据迁移,批计算任务完成一批数据的ETL处理。用户可新建多个不同的任务,完成相应的处理逻辑开发。任务以工作流(DAG图)的形式进行组织,一个工作流可包含一个节点或多个节点,每个节点可以完成一项数据处理操作。
- 实例
任务运行后会产生一个实例,如调度系统配置了某个任务每小时运行一次,那每天会产生24个该任务的实例。
文档内容是否对您有帮助?
评价建议不能为空
非常感谢您的反馈,我们会继续努力做到更好!