金山云-文档中心-通过控制台提交作业

托管Hadoop(KMR)

查看更多结果

未找到含当前关键字的文档标题

页面目录

全部展开全部收起

产品更新动态

未找到含该关键词的产品

文档中心

托管Hadoop(KMR)

KMR Serverless 计算引擎

通过控制台提交作业

最近更新时间：2025-12-19 09:31:39



Serverless 计算引擎支持直观的图形化作业提交方式，用户可通过控制台直接提交多种类型的计算作业，包括 Spark、Ray、Flink 以及自定义 Application 作业类型。在保留命令行与 API 等原有提交方式的基础上，进一步降低了任务配置门槛，支持快速完成作业创建、资源配置、依赖设置与存储挂载等操作。

入口：进入Serverless计算引擎控制台，选择目标工作空间，选择作业提交。点击提交按钮，选择对应的作业类型，进入作业提交页面。

核心配置流程：基本信息-> 作业配置-> 资源配置-> 其他设置-> 确认

提交Spark作业

入口：点击 “提交” 按钮，在作业类型中选择 “Spark”，进入作业提交表单页面。

第一步：填写「基本信息」

配置项	说明	规则/示例
作业名称	作业的唯一标识名称。	规则：1-64个字符。允许：字母、中文、数字、下划线(_)、斜线(/)。限制：必须以字母开头。
作业优先级	定义作业在调度队列中的优先级。	P0：较高优先级。 P1：普通优先级（通常为默认选项）。
作业描述	（可选）对作业的补充说明。	文本描述，最多支持200个字符。

配置建议：建议使用有明确业务含义的作业名称，便于后续检索和管理。

第二步：配置「作业配置」

在此区域定义Spark作业的核心执行参数。作业类型是核心选项，选择不同的类型，下方所需填写的必填项和界面会相应变化。

作业类型	说明	关键配置项与界面变化	填写指引
SparkJar	适用于Scala/Java编写的Jar包程序。	1. 作业主文件 (必填) 2. 主类 (必填) 3. AK/SK (必填) 4. 其他通用选项	• 作业主文件：填写您的Jar包在KS3上的完整路径，如`ks3://bucket/path/your-app.jar`。 • 主类：填写包含main方法的完整类名，如`com.example.YourSparkApp`。
PySpark	适用于Python编写的作业。	1. 作业主文件 3. AK/SK (必填) 4. 其他通用选项	• 作业主文件：填写您的Python脚本在KS3上的完整路径，如`ks3://bucket/path/your_script.py`。 • 其他Python文件或依赖可在“其他设置”的“Files”中指定。
SparkSQL	适用于直接提交SQL脚本。	1. SQL命令 4. AK/SK (必填) 5. 其他通用选项	• SQL命令：在大文本框中直接编写或粘贴要执行的SQL语句。 • 可使用“从模板中加载配置”功能快速填充复杂SQL。

通用配置项说明（适用于所有作业类型）：

配置项	说明	必填/可选
从模板加载配置	从下拉菜单中选择已保存的配置模板，快速填充当前表单。	可选
自定义镜像	从下拉列表中选择您已创建并推送的自定义Docker镜像作为运行环境。	可选
网络连接	从下拉列表中选择作业运行所在的网络环境（如VPC）。	可选
*AK/SK	访问对象存储等受保护资源所需的凭证。 • accessKey：填写您的AccessKey ID。 • secretKey：填写对应的密钥。	必填

第三步：设置「资源配置」

在此区域定义Spark作业执行所需的计算资源。图形化界面通常提供增减按钮进行调节。

资源类型	说明	默认值/建议
Driver核数 (CPU)	分配给Driver进程的CPU核心数量。	默认：1 CPU
Driver内存 (Gi)	分配给Driver进程的内存大小。	默认：4 GiB
Executor核数 (CPU)	每个Executor进程的CPU核心数量。	默认：1 CPU
Executor内存 (Gi)	每个Executor进程的内存大小。	默认：4 GiB
Executor数量	启动的Executor进程实例数。	默认：1

配置建议：根据作业的数据量大小和计算复杂度调整资源配置。大数据量或复杂计算通常需要更多的Executor和更大的内存。

第四步：调整「其他设置」

在此区域配置作业的依赖文件、参数及高级Spark参数。

分类	配置项	说明
依赖与文件	Jars	（可选）指定额外的依赖Jar包路径，多个路径需换行。
	Files	（可选）指定需要分发到工作目录的文件路径，多个需换行。
	Archives	（可选）指定需要分发并解压的归档文件路径（如.zip），多个需换行。
	Packages	（可选）指定来自Maven仓库的依赖坐标，多个需换行。
运行时	ExtraArgs	（可选）传递给主类的命令行参数，每行一个参数。
	ProxyUser	（可选）指定代理提交作业的用户。
Spark参数	Spark配置	（可选）以Key-Value对的形式设置任意的Spark配置属性（如`spark.sql.shuffle.partitions`）。 • 点击 “+添加” 按钮新增配置行。 • 支持最多添加20个自定义配置。