考虑到hive中具有事实表和维度表的典型数据仓库场景,假设事实表通过分区拆分到多个数据节点上。在将事实表(已分区)与维度(未分区)连接时,使用Map连接似乎是合乎逻辑的,因为维度表的大小很小&它们要存储在内存中,以便在所有节点上高效地与事实数据连接。
但是,很少有联机资源建议对分区表执行Map联接,两个表上的分区键应该与联接键相同。
所以,这就是我要寻找答案的问题:
分区表(事实)能否与非分区表(维度)Map联接?
考虑到hive中具有事实表和维度表的典型数据仓库场景,假设事实表通过分区拆分到多个数据节点上。在将事实表(已分区)与维度(未分区)连接时,使用Map连接似乎是合乎逻辑的,因为维度表的大小很小&它们要存储在内存中,以便在所有节点上高效地与事实数据连接。
但是,很少有联机资源建议对分区表执行Map联接,两个表上的分区键应该与联接键相同。
所以,这就是我要寻找答案的问题:
分区表(事实)能否与非分区表(维度)Map联接?
1条答案
按热度按时间i7uq4tfw1#
答案是-是的
Map联接运算符
演示