博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
使用flume替代原有的scribe服务
阅读量:6526 次
发布时间:2019-06-24

本文共 1230 字,大约阅读时间需要 4 分钟。

以前很多业务都是用scribe做日志收集的支撑的,后来fb停止了对scribe的开发支持。而且scribe在机器上编译一次的代价太大了,各种坑,正好后来flume从1.3.0开始加入了对scribe的支持。就可以把原来scribe上面接入的数据转用flume收集了。虽然我很喜欢scribe,但是失去了官方支持毕竟还是很闹心的。

agent.channels=c1agent.channels.c1.capacity=20000agent.channels.c1.transactionCapacity=10000agent.channels.c1.type=memoryagent.sinks=k1agent.sinks.k1.channel=c1agent.sinks.k1.hdfs.batchSize=8000agent.sinks.k1.hdfs.filePrefix=logagent.sinks.k1.hdfs.fileType=DataStreamagent.sinks.k1.hdfs.path=hdfs://NNHA/data/flume/%{category}/%Y%m%dagent.sinks.k1.hdfs.rollCount=0agent.sinks.k1.hdfs.rollInterval=86400agent.sinks.k1.hdfs.round=trueagent.sinks.k1.hdfs.roundUnit=minuteagent.sinks.k1.hdfs.roundValue=1agent.sinks.k1.hdfs.serializer.appendNewline=falseagent.sinks.k1.hdfs.useLocalTimeStamp=trueagent.sinks.k1.hdfs.writeFormat=TEXTagent.sinks.k1.type=hdfsagent.sources=r1agent.sources.r1.channels=c1agent.sources.r1.host=0.0.0.0agent.sources.r1.port=1463agent.sources.r1.type=org.apache.flume.source.scribe.ScribeSourceagent.sources.r1.workerThreads=5

主要是serializer.appendNewline设置为false,否则会每条自动添加一个回车上去,其他也没什么太多好解释的,用过flume的自然秒懂,hdfs.path里面,%{category}就是意味着原来scribe里面的category。

flume 1.6的新特性里面是加入了对kafka的source和sink的支持,以及对数据内容的正则过滤传递,这点很有用,貌似下个月或者下下个月会有本关于flume的新书上市。

转载地址:http://qmvbo.baihongyu.com/

你可能感兴趣的文章
webstorm无法显示左边文件夹目录的解决方法
查看>>
数字校园-云资源平台 2014.10.26-人人通共享空间
查看>>
为你的网站加上SSL,可以使用HTTPS进行访问
查看>>
软件project--谈项目开发
查看>>
在Android中创建文件
查看>>
爬虫基础
查看>>
JS组件系列——再推荐一款好用的bootstrap-select组件,亲测还不错
查看>>
getopt--parse command line options
查看>>
闭包和OC的block的本质
查看>>
MySQL出现Waiting for table metadata lock的场景浅析
查看>>
C# 语言历史版本特性(C# 1.0到C# 7.1汇总更新)
查看>>
什么是数据埋点?
查看>>
git回滚
查看>>
vue2.0 引用qrcode.js实现获取改变二维码的样式
查看>>
Python 判断闰年,判断日期是当前年的第几天
查看>>
web.xml 中的listener、 filter、servlet 加载顺序
查看>>
MyBatis原理简介和小试牛刀
查看>>
js部分基础
查看>>
脏读,幻读,不可重复读解释和例子
查看>>
Tomcat指定(JDK路径)JAVA_HOME而不用环境变量
查看>>