我正在处理流媒体管道,需要“会话化”事件流。事件包含以下信息:
{
"customer_id": "2328323",
"event_type" : "start_session",
"event_timestamp": 1619050887,
... more data
}
事件类型可以是“开始会话”或“结束会话”,这些事件是我会话的边界。我一直在深入研究spark文档,我了解如何通过时间戳、延迟到达数据的水印等进行会话化,但找不到一个好方法来启动带有“start\u session”事件的会话,并以“end\u session”事件或一段不活动时间结束会话。
提前谢谢。
暂无答案!
目前还没有任何答案,快来回答吧!