全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

产品概述

最近更新时间:2023-06-16 11:25:12

大数据云平台(DataCloud)是金山云在智能数字化转型时代推出的新一代大数据智能产品。在主流Hadoop、Spark框架之上构建端到端的大数据智能开发管理闭环,以高度统一的标准提供数据汇聚、数据开发、智能调度、数据管理、数据分析与服务等一站式大数据Web化处理环境,帮助您轻松挖掘数据价值,助力企业数字化运营。

名词解释

- CU
大数据平台计算单元。CU描述了作业的最小运行能力,作业可跑在多个CU上运行。

- DCU
容器计算单元。DCU描述了作业的最小运行能力,作业可跑在多个DCU上运行。

- 资源组
购买的CU/DCU资源可按组进行管理,划分多个资源组,每个资源组按业务量任意分配不同的CU/DCU数。如购买了30个CU,可划分2个资源组,分别分配10CU和20CU。

- 项目
项目是大数据云平台最基本的业务组织单元,主账号可以根据不同的项目需求创建多个项目,每个项目包含不同的大数据云组件,如项目1包含数据采集和流计算组件,项目2包含数据集成和批计算组件。项目管理员可以将不同的人加入到不同的项目中,实现多人协作开发,项目制管理。

- 任务
数据处理逻辑的封装,如数据同步任务完成数据从源库到目的库的数据迁移,批计算任务完成一批数据的ETL处理。用户可新建多个不同的任务,完成相应的处理逻辑开发。任务以工作流(DAG图)的形式进行组织,一个工作流可包含一个节点或多个节点,每个节点可以完成一项数据处理操作。

- 实例
任务运行后会产生一个实例,如调度系统配置了某个任务每小时运行一次,那每天会产生24个该任务的实例。

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈