我已经将带有分区配置单元表的数据库的数据和文件夹结构从一个hdfs示例复制到另一个示例。
如何对配置单元元数据执行相同的操作?我需要新hdfs示例的配置单元使用现有分区定义这个数据库及其表,就像在原始位置一样。当然,它们通常需要在更新hdfs外部表位置时维护其原始模式。
乐于使用直接的配置单元命令、spark或任何开放源代码且随时可用的通用cli实用程序。我没有实际的hadoop集群(这是云存储),所以请避免使用依赖map reduce/etc的答案(比如sqoop)。
我已经将带有分区配置单元表的数据库的数据和文件夹结构从一个hdfs示例复制到另一个示例。
如何对配置单元元数据执行相同的操作?我需要新hdfs示例的配置单元使用现有分区定义这个数据库及其表,就像在原始位置一样。当然,它们通常需要在更新hdfs外部表位置时维护其原始模式。
乐于使用直接的配置单元命令、spark或任何开放源代码且随时可用的通用cli实用程序。我没有实际的hadoop集群(这是云存储),所以请避免使用依赖map reduce/etc的答案(比如sqoop)。
1条答案
按热度按时间evrscar21#
使用配置单元命令:
这将打印create table语句。复制并将表类型更改为外部、位置、架构、列名(如有必要),然后执行。
创建表后,使用此命令创建元数据分区
amazon elastic mapreduce(emr)版本的hive上的等效命令是:
ALTER TABLE tablename RECOVER PARTITIONS;
这将添加配置单元分区元数据。请参阅此处的手册:恢复分区