最近更新时间:2026-01-22 17:42:37
本文档介绍如何使用作业提交界面创建和提交 Flink 任务。该界面提供了完整的配置选项,包括基础作业信息和高级资源配置。
1. 进入作业创建页面
点击"新建作业"按钮,进入作业创建页面。
2. 选择作业类型
Flink:用于提交 Flink 应用程序
填写必填字段
作业名称
Jar uri
配置资源和其他设置(可选)
根据任务需求调整资源配置
配置检查点和状态后端
添加应用程序参数和依赖文件
检查配置
确认所有必填字段已填写
检查资源配置是否合理
验证路径和格式是否正确
确认 JSON 格式的有效性
提交作业
点击"确定"按钮提交作业
点击"取消"按钮放弃当前配置
*作业名称 |
|
*Jar包路径 Jar Uri |
|
主程序类 Entrypoint class |
|
程序参数 Entrypoint main args |
|
Job核数 |
|
Job内存 |
|
Task核数 |
|
Task内存 |
|
并行度 Parallelism |
|
Slot数 Number of task slots |
|
Checkpoint间隔 |
|
初始化Savepoint路径 |
|
容器镜像 |
|
自定义配置 Conf |
主要配置项说明:
|
基础配置:
作业名称:flink-test
Jar uri:ks3://bigdata-flink-test/jars/flink_demo-1.0-SNAPSHOT.jar
Entrypoint class:com.example.StreamingJob
高级配置(使用默认值):
Job 核数:2
Job 内存:8G
Task 核数:1
Task 内存:4G
并行度:1
slots数:1
Checkpoint间隔:30000
基础配置:
作业名称:high_performance_streaming
Jar包路径:ks3://bucket/apps/flink-app.jar
主程序类:com.example.HighPerformanceJob
程序参数:
ks3://bucket/data/input
ks3://bucket/data/output高级配置:
Job 核数:4
Job 内存:16G
Task 核数:2
Task 内存:8G
并行度:10
Slot数:2
镜像:hub.kce.ksyun.com/cbd-serverless-spark/flink:1.19.0-ksc0.1
Checkpoint 间隔:60000
自定义配置(JSON 格式):
{
"state.backend": "rocksdb",
"state.backend.incremental": "true",
"execution.checkpointing.mode": "EXACTLY_ONCE",
"execution.checkpointing.interval": "60000",
"restart-strategy": "fixed-delay",
"restart-strategy.fixed-delay.attempts": "5",
"restart-strategy.fixed-delay.delay": "10s"
}合理配置资源
根据数据量和任务复杂度配置资源
避免过度配置导致资源浪费
确保集群有足够的可用资源
内存配置建议
JobManager 内存应考虑作业管理开销
TaskManager 内存应预留部分给系统开销
一般建议保留 10-20% 的系统开销
并行度调整
Parallelism × Number of task slots ≈ Task 总数 × Slot 数
可以根据数据流特点调整
过高的并行度可能导致小任务过多
过低的并行度可能影响吞吐量
并行度设置
根据数据流特点设置合适的并行度
考虑数据倾斜问题
可以通过 KeyBy 调整数据分布
检查点优化
启用增量检查点减少开销
合理设置检查点间隔
使用异步检查点提升性能
资源优化
TaskManager Slot 数通常等于 CPU 核心数
避免过度分配资源
监控资源利用率
纯净模式
