本文共 864 字,大约阅读时间需要 2 分钟。
实时流处理概述: 数据量大 时效性高
需求:使用分布式日志收集框架Flume,从指定网络端口采集数据输出到控制台
环境参数
scala 2.11.8
官网
【地址】
【配置文件截图】
# example.conf: A single-node Flume configuration# Name the components on this agenta1.sources = r1a1.sinks = k1a1.channels = c1# Describe/configure the sourcea1.sources.r1.type = netcata1.sources.r1.bind = localhosta1.sources.r1.port = 44444# Describe the sinka1.sinks.k1.type = logger# Use a channel which buffers events in memorya1.channels.c1.type = memorya1.channels.c1.capacity = 1000a1.channels.c1.transactionCapacity = 100# Bind the source and sink to the channela1.sources.r1.channels = c1a1.sinks.k1.channel = c1
配置文件解析
agent 代理人 source 来源 sink 下沉 channel 通道
启动Flume
flume-ng agent --name a1 --conf $FLUME_HOME/conf --conf-file $FLUME_HOME/conf/flume.conf -Dflume.root.logger=INFO,console【参数解析】
指定代理 name conf文件 位置 conf 文件 打印到控制台
用另一个控制台使用命令 telnet hadoop 44444
转载地址:http://ytazi.baihongyu.com/