dinky
dinky copied to clipboard
[dinky-admin] Fix issue where a job is still running but Dinky shows …
问题 在以下场景下,任务实际仍在运行,但 Dinky 显示任务状态为失败或未知,且任务名旁的小火苗消失:
-
任务由 Flink Operator 管理,Operator对任务进行重新部署后导致jobId 发生变化。
-
任务由 Flink Operator 管理,失败的任务被重新拉起并成功运行。
-
K8s 模式下,Dinky 启动任务超时,但任务实际已在 K8s 中启动成功。
-
K8s 模式下,任务 pod 被临时缩容为 0,导致 Dinky 误判为失败。
-
Dinky 获取 Flink 任务数据时,误将任务标记为未知。
变更
-
更新任务信息时,先检查 jobId 是否变化,如变化则更新任务实例的 jobId。
-
每隔五分钟检查一次失败任务,如发现任务已重新运行成功,则将其重新放回监控队列。