我有1000个rest web服务。需要将数据摄取到数据湖的标准方法吗?满负荷和cdc和流数据也。数据要加载到Kafka主题而不重复
3bygqnnd1#
您的web服务可以使用kafka producer api直接向kafka发送数据,如果希望对数据进行流处理,也可以使用kafka streams api。kafka connect api是如何将数据从其他源(数据库等)流式传输到kafka主题的。从kafka,您可以使用kafkaconnect的hdfs连接器将主题中的数据流传输到hdfs/s3等。
1条答案
按热度按时间3bygqnnd1#
您的web服务可以使用kafka producer api直接向kafka发送数据,如果希望对数据进行流处理,也可以使用kafka streams api。kafka connect api是如何将数据从其他源(数据库等)流式传输到kafka主题的。
从kafka,您可以使用kafkaconnect的hdfs连接器将主题中的数据流传输到hdfs/s3等。