我是Druid的新手。我们正在使用DruidHive集成。从Hive加载数据。
探索Druid数据源和Hive兽人之间的大小。
已创建druid数据源:
创建由'org.apache.hadoop.hive.druid.druidstoragehandler'存储的外部表druid\u table作为select tme
作为 __time
, dm1
, dm2
来自Druid之源的测试;
已创建配置单元外部表:
创建外部表hive\u表存储为orc as select tme
作为 __time
, dm1
, dm2
来自Druid之源的测试;
两个表中都有相同的数据集。hive orc表的大小是25mb,而druid datasource占用了大约60mb的存储空间。
druid索引zip文件有以下文件。为什么Druid的体型比Hive兽人大?Druid压迫发生在我身上?我是否缺少一些配置来完成压缩?Maven们请澄清。
版本.bin
工厂.json
00000
meta.斯摩什
暂无答案!
目前还没有任何答案,快来回答吧!