[数据平台]07 数据平台之调度系统
调度系统[任务处理场景、任务处理需求、调度系统功能]、常用开源调度框架对比、[Azkaban介绍、Azkaban优点、Azkaban适用场景]、Azkaban架构与调度流程[Azkaban部署模式、Azkaban执行流程图、Azkaban核心交互流程]、Azkazban安装部署[前置环境、Azkaban编译、配置azkaban数据库、部署Azkaban-Web-Server、部署Azkaban Exec Server、Azkaban示例]、Azkaban用户代理[Azkaban任务类型、Azkaban代理用户]
调度系统任务处理现状
搭建Hadoop集群,实现了离线数仓的基础架构
编写HQL定时对数据进行计算,生成T+1的离线数据
不同的任务编写成不同的HQL文件,通过Crontab进行调度
安排几十个计算的先后顺序,避免顺序颠倒导致计算错误
一个任务失败,后续任务全部等待,效率很低
任务太多,串行执行时间太长
任务处理场景
原始数据为业务数据库or FTP存储的文件类数据
通过Shell脚本或者......