选择你喜欢的标签
我们会为你匹配适合你的网址导航

    确认 跳过

    跳过将删除所有初始化信息

    Apache DolphinScheduler分布式工作流任务调度系统

    技术 2023-06-28 16:01

    声明:该文章由作者(王家胜)发表,转载此文章须经作者同意并请附上出处(0XUCN)及本页链接。。

    Apache DolphinScheduler(Incubator, 原 Easy Scheduler) 是一个可视化的分布式大数据工作流任务调度系统,DolphinScheduler 致力于 “可视化操作工作流 (任务) 之间的依赖关系,并可视化监控整个数据处理过程”。DolphinScheduler 以有向无环图 (DAG) 的方式将任务组装起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及 Kill 任务等操作。

    DolphinScheduler 的起源 - 需求决定

    大数据任务调度需要解决以下痛点,市面上难以找到满足需求的开源大数据调度,这是 DolphinScheduler 诞生的原因

    DolphinScheduler 设计特点

     一个分布式易扩展的可视化 DAG 工作流任务调度系统。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。 其

    主要目标如下

    以 DAG 图的方式将 Task 按照任务的依赖关系关联起来,可实时可视化监控任务的运行状态

    支持丰富的任务类型:Shell、MR、Spark、SQL (mysql、postgresql、hive、sparksql),Python,Sub_Process、Procedure 等

    支持工作流定时调度、依赖调度、手动调度、手动暂停 / 停止 / 恢复,同时支持失败重试 / 告警、从指定节点恢复失败、Kill 任务等操作

    支持工作流优先级、任务优先级及任务的故障转移及任务超时告警 / 失败

    支持工作流全局参数及节点自定义参数设置

    支持资源文件的在线上传 / 下载,管理等,支持在线文件创建、编辑

    支持任务日志在线查看及滚动、在线下载日志等

    实现集群 HA,通过 Zookeeper 实现 Master 集群和 Worker 集群去中心化

    支持对 Master/Worker cpu load,memory,cpu 在线查看

    支持工作流运行历史树形 / 甘特图展示、支持任务状态统计、流程状态统计

    支持补数

    支持多租户

    支持国际化

    关注我们

    [超站]友情链接:

    四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
    关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/

    图库