最近更新时间:2026-05-20 16:38:29
星流平台数据处理模块预置了Spark、Ray等计算框架,支持分布式执行大规模的自定义数据处理任务,提升用户开发效率。
已创建相应资源配置。
建议您在资源组中开启关联托管Prometheus、Klog服务,以便后续查看任务监控及日志。
登录金山云星流训推平台控制台。
在顶部导航栏,选择数据准备 > 数据处理。
在数据处理页,单击+新建,选择提交的任务类型。目前支持Spark任务、Ray任务、Flink任务和数据同步任务。
参考以下参数说明,完成参数配置,单击确定,提交运行。
分类 | 参数 | 是否必须 | 说明 |
|---|---|---|---|
基础信息 | 任务名称 | 是 | 1-64个字符,允许字母、中文、数字-_、/()。 |
优先级 | 是 |
| |
描述 | 否 | 描述信息,长度0-200个字符。 | |
任务配置 | AK/SK | 是 |
|
Entrypoint.cmd | 是 |
| |
镜像 | 否 | ||
Head核数 | 否 | Ray任务Head节点核数。 | |
Head内存 | 否 | Ray任务Head节点内存。 | |
Worker数量 | 否 | Ray任务Worker节点数量。 | |
Worker核数 | 否 | Ray任务Worker节点核数。 | |
Worker内存 | 否 | Ray任务Worker节点内存。 | |
WorkerGPU数量 | 否 | Ray任务使用的GPU卡数。 | |
Entrypoint.resource | 否 |
| |
Runtime_env | 否 |
"working_dir": "s3://bigdata/job/ksyun-ray-demo.zip" } | |
Conf | 否 | Ray任务的其他参数配置,key1=value1形式填写,支持添加添加多个。 | |
Juice Fs | 否 | JuiceFs配置,Ray head节点挂载,juiceFs存储卷。 | |
MountPath | 否 | 挂载路径。 | |
资源配置 | 资源类型 | 是 | 支持使用自运维资源或Serverless计算引擎资源。
|
权限配置 | 是否队列内公开可见 | 否 |
|
分类 | 参数 | 是否必须 | 说明 |
|---|---|---|---|
基础信息 | 任务名称 | 是 | 1-64个字符,允许字母、中文、数字-_、/()。 |
优先级 | 是 |
| |
描述 | 否 | 描述信息,长度0-200个字符。 | |
任务配置 | AK/SK | 是 |
|
AppResource | 否 |
| |
Class | 是 |
| |
镜像 | 否 | ||
Driver核数 | 否 | 任务的Driver核数。 | |
Driver内存 | 否 | 任务的Driver内存。 | |
Executor数量 | 否 | 任务的Executor数量。 | |
Executor核数 | 否 | 任务的Executor核数。 | |
Executor内存 | 否 | 任务的Executor内存。 | |
ExtraArgs | 否 | 额外参数组,支持添加多条。 | |
Conf | 否 | 任务的其他参数配置,key1=value1形式填写,支持添加添加多个。 | |
Jars | 否 | 任务需要引用的Jar包资源,需要上传至KS3,填写KS3路径。 | |
Files | 否 | 任务需要引用的资源文件,需要上传至KS3,填写KS3路径。。 | |
PyFiles | 否 | 任务需要引用的Python脚本,需要上传至KS3,填写KS3路径。 | |
Archives | 否 | 任务需要引用的Archives包资源,需要上传至KS3,填写KS3路径。 | |
Packages | 否 | 任务需要引用的外部依赖包,需要上传至KS3,填写KS3路径。 | |
CacheFile | 否 | 用于缓存加速archive资源。 | |
ProxyUser | 否 | 设置代理用户,实现用户直接的资源隔离和安全授权。 | |
资源配置 | 资源类型 | 是 | 支持使用自运维资源或Serverless计算引擎资源。
|
权限配置 | 是否队列内公开可见 | 否 |
|
目前仅支持KS3、KPFS(容量型、性能型)之间数据同步。
分类 | 参数 | 是否必须 | 说明 |
|---|---|---|---|
基础信息 | 任务名称 | 是 | 1-64个字符,允许字母、中文、数字-_、/()。 |
优先级 | 是 |
| |
描述 | 否 | 描述信息,长度0-200个字符。 | |
任务配置 | 同步源 | 是 |
|
同步目标 | 是 | 同上。 | |
资源配置 | 资源类型 | 是 |
|
权限配置 | 是否队列内公开可见 | 否 |
|
纯净模式
