很好的一天。我正在使用spark实时读取rest-push-api数据,并将数据加载到hbase表中。实时数据还将包含对hbase表中现有数据的更新,我正在考虑几个选项来处理它
必须根据密钥对实际数据执行更新。
基于密钥创建另一个版本的数据。以便在从报表工具读取数据时,可以从加载的最新记录中读取数据。
我能知道在这种情况下哪种方法最好吗?
如果我需要使用第1点,那么如何对physical hbase表中的实际数据执行更多的实时更新,在physical hbase表中,我的streaming spark作业每2分钟运行一次。
如果我使用第2点,报告工具读取数据以在 Jmeter 板中显示实时更新的速度,以及数据的一致性。
请分享你的回答。
谢谢您。
暂无答案!
目前还没有任何答案,快来回答吧!