由于spark流式处理以微批量方式消耗数据,所以在使用xml消息时会出现问题吗?如果我将整个xml文件作为单个消息发布到kafka主题,那么在使用spark streaming时,是否有可能因为消息大小而拆分xml文件内容。spark流将在两个不同的数据流中使用单个xml消息吗?这种情况有效吗?请告知。
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!