我想使用以下命令使用Kafka主题中的数据:
bin/kafka-console-consumer.sh—引导服务器localhost:9092 --topic mytesttopic--从头开始
然后将输出以下内容(仅粘贴前2行输出,但将有多行…):
&time=1561768216000&gameCategory=PINPOINT&category=ONE&uniqueId=2518Z-0892A-0030O-16H70&transactionType=CRD&familyId=000-222-115-11119&realTs=1561768319000&sortId=1&msg=SET-UP+PRAYER+%26+intercession+begins+in+just+30+minutes.&remoteIpAddress=127.0.0.1&userAgent=HTTP&
&uniqueId=872541806296826880&time=1571988786000&gameCategory=NOTIFY&category=TWO&transactionType=CRD&familyId=401-222-115-89387&sortId=1&realTs=1571988989000&msg=This-is+a+reminder.&remoteIpAddress=127.0.0.1&userAgent=HTTPS&
我想从输出中使用以下内容:
不动产
家庭ID
味精
独一无二的
您可以看到每个元素都用一个符号('&')分隔。它们不总是在同一个索引/位置,所以我不确定是否需要正则表达式?最终,当我在本地运行的mysql上进行查询时,我会看到:
描述测试表;
+----------+--------------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+----------+--------------+------+-----+---------+-------+
| realTs | bigint(20) | YES | | NULL | |
| familyId | varchar(255) | YES | | NULL | |
| msg | text | YES | | NULL | |
| uniqueId | varchar(255) | YES | | NULL | |
+----------+--------------+------+-----+---------+-------+
4 rows in set (0.00 sec)
从测试表中选择*;
+---------------+-------------------+-----------------------------------------------------------+-------------------------+
| realTs | familyId | msg | uniqueId |
+---------------+-------------------+-----------------------------------------------------------+-------------------------+
| 1561768319000 | 000-222-115-11119 | SET-UP+PRAYER+%26+intercession+begins+in+just+30+minutes. | 2518Z-0892A-0030O-16H70 |
| 1571988989000 | 401-222-115-89387 | This-is+a+reminder. | 872541806296826880 |
+---------------+-------------------+-----------------------------------------------------------+-------------------------+
到目前为止我有什么?我有一个带python的mysql连接器,我可以连接到本地mysql等等,但是我正在努力解析并插入它。。。
1条答案
按热度按时间vxbzzdmp1#
对于python,您可以使用
urllib.parse.parse_qs
在python字典中检索url查询字符串组件,您可以稍后迭代以在mysql数据库中插入数据。例如:
结果: