全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

产品概述

最近更新时间:2023-06-16 11:46:59

离线计算提供多种编程形式,支持在线进行可视化的流程编排和代码编写,高效完成大数据离线计算的核心业务开发,通过离线计算服务,可进行离线计算的任务调度管理、运行情况监控和告警等在线运维管理。

名词解释

作业流
作业流是指一个由作业节点组成的图。每个作业节点按照配置完成一定的处理逻辑。作业节点之间通过有向边进行依赖关联,但关联时不能形成环路。一个画布中的全部作业节点及其依赖称为一个作业流。一般来说,在作业流调度模型中,作业流为调度单元,而其中的作业节点为最小粒度的执行单元。

作业
作业流中的一个节点,即由用户定义的完成一定工作的逻辑单元。在任务调度模型中,作业(或任务)是最小执行单元。

插件
一个作业配置模板,它包含了作业类型和该种类型作业的必要参数,通过插件创建作业时,只需要填写作业类型和必要的参数就可以完成作业的创建,可以极大的节省创建作业的时间。

算子
一段可被高度提炼的逻辑,比如一段被高频率使用的SQL,算子必须依赖于插件存在,并最终可被插件解释和执行。

依赖包
被作业依赖的外部资源,比如一个jar文件。

在线测试
作业流提交到测试环境执行,通过ENV_ID区分,在线测试不需要作业流是发布状态,任何状态都可以测试。

作业测试
同在线测试,但仅运行单个节点作业。

立即执行
将作业流提交到生产环境运行,作业流状态必须是已发布状态。

提交调度
将作业流提交到生产环境并按指定频率运行,作业流状态必须是已发布状态。

项目管理员
项目管理员具有项目下的所有权限,可以添加或删除项目成员,项目成员又分为开发人员和运维人员。

运维人员
主要负责作业流的执行、调度及审批等。

开发人员
负责作业流的开发,资源维护、UDF开发等。

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈