产品概述

最近更新时间:2021-03-24 14:14:24

查看PDF

大数据云平台(Cubricks)是金山云在智能数字化转型时代推出的新一代大数据智能产品。在主流Hadoop、Spark框架之上构建端到端的大数据智能开发管理闭环,以高度统一的标准提供数据汇聚、数据开发、智能调度、数据管理、数据分析与服务等一站式大数据Web化处理环境,帮助您轻松挖掘数据价值,助力企业数字化运营。

名词解释

- CU
大数据平台计算单元。CU描述了作业的最小运行能力,作业可跑在多个CU上运行。

- DCU
容器计算单元。DCU描述了作业的最小运行能力,作业可跑在多个DCU上运行。

- 资源组
购买的CU/DCU资源可按组进行管理,划分多个资源组,每个资源组按业务量任意分配不同的CU/DCU数。如购买了30个CU,可划分2个资源组,分别分配10CU和20CU。

- 项目
项目是大数据云平台最基本的业务组织单元,主账号可以根据不同的项目需求创建多个项目,每个项目包含不同的大数据云组件,如项目1包含数据采集和流计算组件,项目2包含数据集成和批计算组件。项目管理员可以将不同的人加入到不同的项目中,实现多人协作开发,项目制管理。

- 任务
数据处理逻辑的封装,如数据同步任务完成数据从源库到目的库的数据迁移,批计算任务完成一批数据的ETL处理。用户可新建多个不同的任务,完成相应的处理逻辑开发。任务以工作流(DAG图)的形式进行组织,一个工作流可包含一个节点或多个节点,每个节点可以完成一项数据处理操作。

- 实例
任务运行后会产生一个实例,如调度系统配置了某个任务每小时运行一次,那每天会产生24个该任务的实例。

文档内容是否对您有帮助?

根本没帮助
文档较差
文档一般
文档不错
文档很好

在文档使用中是否遇到以下问题

内容不全,不深入
内容更新不及时
描述不清晰,比较混乱
系统或功能太复杂,缺乏足够的引导
内容冗长

更多建议

0/200

评价建议不能为空

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

问题反馈