我正在设计一个工作流,以使用NIFI获取增量提取,源数据库和目标数据库均位于MySQL中。处理器为QueryDatabaseTable和splitAvro和convertAvroToJson和convertJsonToSQL以及PutSQL,如下图所示
和querydatabasetable的配置参数如下
现在,源数据库表只有200条记录,当我开始这个过程时,流正在重复接收相同的记录。
我已将最大值列设置为 createTime,即时间戳,其值为
2017-12-07 18:48:23
所有200张唱片。
我还用ID替换了maximum-value columns,但这也导致了同样的问题。是什么原因导致了这种重复摄取?
1条答案
按热度按时间vshtjzan1#
根据covertJSONtoSQL returning empty values in NiFi中@mattyb的建议,我将spiltAvro和convertAvroToJson和convertJsonToSQL和PutSQL替换为PutDatabaseRecord处理器,并且它与增量摄取一起工作。
流将如下所示,其中最大值列属性已设置为ID,time_stamp