我在hdfs(hadoop文件系统)上有一个数据库和一个模式文件。我正在尝试从配置单元连接到此现有数据库。非常感谢你的指点。
ubof19bj1#
不知道您所说的数据库是什么意思,但是使用hive的外部表特性,这相当容易。您需要3样东西:数据的位置,读取(写入)数据(行)的输入(输出)格式,以及解释数据(列)的serde。如果您需要保持您的配置单元模式和外部模式同步,没有现成的好方法。您必须编写一些自定义代码来监视源模式,并在模式更改时修改配置单元模式。虽然不琐碎,但也很容易做到这一点。
1条答案
按热度按时间ubof19bj1#
不知道您所说的数据库是什么意思,但是使用hive的外部表特性,这相当容易。您需要3样东西:数据的位置,读取(写入)数据(行)的输入(输出)格式,以及解释数据(列)的serde。如果您需要保持您的配置单元模式和外部模式同步,没有现成的好方法。您必须编写一些自定义代码来监视源模式,并在模式更改时修改配置单元模式。虽然不琐碎,但也很容易做到这一点。