这几天在测试NiFi的环境,正式环境准备使用一个3个节点的集群。
测试了一个从单节点环境迁移过去的模板,发生了一个没想到的问题,GenerateFlowFile生成了大于一个的 Flowfile。
模拟流程很简单,我只是把GenerateFlowFile作为一个定时器用.
查了一下文档,发现在cluster环境下process可以运行在primary node或all nodes上, 只要设置成primary node,就可以避免这个问题。
有这点需要注意下,由于从1.0版本开始NiFi已经变成了Zero Master Clustering 的架构, 所谓的primary node是ZooKeeper选举出来的,不是指定在特定机器上。
除了这个GenerateFlowFile问题外,使用NIFi接受数据,也会有问题,这个可以参考这篇
另:今天看到一个博客(https://pierrevillard.com),很多NiFi有用的内容,可以参考下.How Do I Distribute Data Across an Apache NiFi Cluster?
update 2018-09-29: 最近发现是流程都在同一个节点处理,可能存在问题,具体怎么处理还待解决?