最近更新时间:2025-11-21 19:07:18
本文档介绍如何使用作业提交界面创建和提交 Flink 任务。该界面提供了完整的配置选项,包括基础作业信息和高级资源配置。
1. 进入作业创建页面
点击"新建作业"按钮,进入作业创建页面。
2. 选择作业类型
在页面顶部选择作业类型:
Flink:用于提交 Flink 应用程序
填写必填字段
作业名称
Jar uri
配置高级设置(可选)
根据任务需求调整资源配置
设置认证信息(如需要)
配置检查点和状态后端
添加应用程序参数和依赖文件
检查配置
确认所有必填字段已填写
检查资源配置是否合理
验证路径和格式是否正确
确认 JSON 格式的有效性
提交作业
点击"确定"按钮提交作业
点击"取消"按钮放弃当前配置
*作业名称 |
|
*作业提交 Jar uri |
|
Job核数 |
|
Job内存 |
|
Task数量 |
|
Task核数 |
|
Task内存 |
|
AK |
|
SK |
|
镜像 |
|
Conf |
主要配置项说明:
|
Entrypoint class |
|
Entrypoint main args |
|
Parallelism |
|
Number of task slots |
|
Initial savepoint path |
|
Enable checkpoint |
|
Checkpoint interval 检查时间间隔 |
|
基础配置:
作业名称:flink-test
Jar uri:ks3://bigdata-flink-test/jars/flink_demo-1.0-SNAPSHOT.jar
Entrypoint class:com.example.StreamingJob
高级配置(使用默认值):
Job 核数:2
Job 内存:8G
Task 数量:2
Task 核数:1
Task 内存:4G
Parallelism:1
Number of task slots:1
Enable checkpoint:是
Checkpoint interval:30000
基础配置:
作业名称:high_performance_streaming
Jar uri:ks3://bucket/apps/flink-app.jar
Entrypoint class:com.example.HighPerformanceJob
Entrypoint main args:
ks3://bucket/data/input
ks3://bucket/data/output高级配置:
Job 核数:4
Job 内存:16G
Task 数量:5
Task 核数:2
Task 内存:8G
Parallelism:10
Number of task slots:2
镜像:hub.kce.ksyun.com/cbd-serverless-spark/flink:1.19.0-ksc0.1
Enable checkpoint:是
Checkpoint interval:60000
Conf(JSON 格式):
{
"state.backend": "rocksdb",
"state.backend.incremental": "true",
"execution.checkpointing.mode": "EXACTLY_ONCE",
"execution.checkpointing.interval": "60000",
"restart-strategy": "fixed-delay",
"restart-strategy.fixed-delay.attempts": "5",
"restart-strategy.fixed-delay.delay": "10s"
}合理配置资源
根据数据量和任务复杂度配置资源
避免过度配置导致资源浪费
确保集群有足够的可用资源
内存配置建议
JobManager 内存应考虑作业管理开销
TaskManager 内存应预留部分给系统开销
一般建议保留 10-20% 的系统开销
并行度调整
Parallelism × Number of task slots ≈ Task 总数 × Slot 数
可以根据数据流特点调整
过高的并行度可能导致小任务过多
过低的并行度可能影响吞吐量
并行度设置
根据数据流特点设置合适的并行度
考虑数据倾斜问题
可以通过 KeyBy 调整数据分布
检查点优化
启用增量检查点减少开销
合理设置检查点间隔
使用异步检查点提升性能
资源优化
TaskManager Slot 数通常等于 CPU 核心数
避免过度分配资源
监控资源利用率
纯净模式
