news 2026/5/21 6:55:19

如何使用 Apache DolphinScheduler 调度执行 Flume 数据采集任务?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何使用 Apache DolphinScheduler 调度执行 Flume 数据采集任务?

转载自天地风雷水火山泽

目的

因为我们的数仓数据源是Kafka,离线数仓需要用Flume采集Kafka中的数据到HDFS中。
在实际项目中,我们不可能一直在Xshell中启动Flume任务,一是因为项目的Flume任务很多,二是一旦Xshell页面关闭Flume任务就会停止,这样非常不方便,因此必须在后台启动Flume任务。
所以经过测试后,我发现海豚调度器也可以启动Flume任务。

海豚调度Flume任务配置

(一)Flume在Linux中的路径

(二)Flume任务文件在Linux中的位置以及任务文件名

(三)在海豚中配置运行脚本

#!/bin/bash source /etc/profile /usr/local/hurys/dc_env/flume/flume190/bin/flume-ng agent -n a1 -f /usr/local/hurys/dc_env/flume/flume190/conf/statistics.properties

注意:/usr/local/hurys/dc_env/flume/flume190/为Flume在Linux中的安装,根据自己安装路径进行调整

(四)海豚任务配置好后就可以启动海豚任务

(五)在HDFS对应文件夹中验证是否采集到数据

可以看到,Flume采集Kafka数据成功写入到HDFS中,成功实现用Apache DolphinScheduler执行Flume任务的目的!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/21 6:47:06

【Redis | 第一篇】Redis常见命令

目录 一、Redis数据结构介绍 二、Redis的通用命令 三、String类型 3.1 key的层级结构 四、Hash类型 五、List类型 六、Set类型 一、Redis数据结构介绍 Redis是一个key-value的数据库,key一般是字符串类型,不过value的类型多种多样。 二、Redis的…

作者头像 李华
网站建设 2026/5/21 6:45:07

OT边缘技术实战:安全连接DCS与云端,释放工业数据价值

1. 从孤岛到云端:为什么工厂控制系统的连接性变革势在必行在工厂干了十几年,我亲眼见证了控制室从堆满图纸和记录仪的“信息孤岛”,演变成如今数据实时流动的“决策中枢”。过去,操作技术(OT)网络&#xff…

作者头像 李华
网站建设 2026/5/21 6:42:30

肖有米开发团队:裕健贝力平台系统模式介绍

一、系统定位:订单驱动的身份状态机裕健贝力平台在技术本质上,是一套基于订单累积量的用户身份状态管理系统。其核心业务逻辑并非传统的“购物返佣”,而是通过“自购分享”产生的有效订单量,来驱动用户身份(如区县代、…

作者头像 李华
网站建设 2026/5/21 6:38:10

一文搞懂 MySQL:一条 SQL 语句的完整执行之旅

你是否每天都在写 SQL,却从未想过它在 MySQL 内部是如何一步步执行的?今天我们就通过这张经典的 MySQL 执行流程图,带你拆解一条 SQL 从客户端发送到结果返回的完整过程,搞懂这个过程,你就能轻松理解 SQL 优化、事务原…

作者头像 李华