python生成不同的kafka分区

vnzz0bqm 于 2021-06-04 发布在 Kafka

关注(0)|答案(2)|浏览(413)

我试图通过典型的推特流媒体示例来学习Kafka。我试图使用我的生产者流推特数据基于2个过滤器到同一主题的不同分区。例如，twitter数据track='google'到一个分区，track='apple'到另一个分区。

class Producer(StreamListener):
    def __init__(self, producer):
        self.producer = producer
    def on_data(self, data):
        self.producer.send(topic_name, value=data)
        return True
    def on_error(self, error):
        print(error)
twitter_stream = Stream(auth, Producer(producer))
twitter_stream.filter(track=["Google"])

如何添加另一个磁道并将数据流到另一个分区。
同样，如何让我的消费者从特定分区消费。

consumer = KafkaConsumer(
    topic_name,
     bootstrap_servers=['localhost:9092'],
     auto_offset_reset='latest',
     enable_auto_commit=True,
     auto_commit_interval_ms =  5000,
     max_poll_records = 100,
     value_deserializer=lambda x: json.loads(x.decode('utf-8')))

python apache-kafka twitter-streaming-api

来源：https://stackoverflow.com/questions/63834532/python-produce-to-different-kafka-partition

2条答案

按热度按时间

2w2cym1i1#

经过一番研究，我终于解决了这个问题：
在producer端，指定分区：

self.producer.send(topic_name, value=data,partition=0)

在消费者方面，

consumer = KafkaConsumer(
       bootstrap_servers=['localhost:9092'],
     auto_offset_reset='latest',
     enable_auto_commit=True,
     auto_commit_interval_ms =  5000,
     max_poll_records = 100,
     value_deserializer=lambda x: json.loads(x.decode('utf-8')))
consumer.assign([TopicPartition('trial', 0)])