我目前正在使用Kafka沿着Debezium从Mongo数据库中摄取一些数据。当数据被摄取时,模式注册表(Confluent)显示一些额外的不需要的信息,导致模式版本比预期的多。这是一种“不需要的”模式:
...
{
"connect.name": "mongodbserver1.data_transformer.api_data_asset.content.text_representation",
"fields": [
{
"default": null,
"name": "language",
"type": [
"null",
"string"
]
},
{
"default": null,
"name": "script",
"type": [
"null",
"string"
]
}
],
"name": "text_representation",
"namespace": "mongodbserver1.data_transformer.api_data_asset.content",
"type": "record"
}
]
},
...
有没有办法避免这种类型的模式信息?
1条答案
按热度按时间ckx4rj1h1#
根据这一点,在数据库中有一个text_representation Object,因此,它将成为模式的一部分。
您可以选择使用Connect转换在记录实际传递到AvroConverter之前更改记录的格式,AvroConverter决定注册到注册表的内容,而不是Debezium。