我刚刚开始研究一个hadoop用例,它可以近乎实时地分析cdr。CDR编码在asn1.1中。远程服务器由CDR定期提供数据。我想知道如何从这个服务器接收CDR到我的集群中,并对它们进行解码以生成可以由hive(或spark streaming…)处理的csv文件。flume是否适合接收此类数据?你认为我应该什么时候解码asn1.1,在摄入之前还是之后?我有一个用c写的程序来解码asn1.1。如果flume适合接收数据,我应该在包含初始数据的服务器中实现avro客户机,还是有其他合适的方法?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!