我想使用presto来查询作为Parquet文件存储在s3中的冰山表,因此我需要使用hivemetastore。我正在运行一个由mysql支持的独立配置单元元存储服务。我已将iceberg配置为使用配置单元目录:
import org.apache.hadoop.conf.Configuration;
import org.apache.iceberg.catalog.Namespace;
import org.apache.iceberg.hive.HiveCatalog;
public class MetastoreTest {
public static void main(String[] args) {
Configuration conf = new Configuration();
conf.set("hive.metastore.uris", "thrift://x.x.x.x:9083");
conf.set("hive.metastore.warehouse.dir", "s3://bucket/warehouse");
HiveCatalog catalog = new HiveCatalog(conf);
catalog.createNamespace(Namespace.of("my_metastore"));
}
}
我得到以下错误: Caused by: MetaException(message:Got exception: org.apache.hadoop.fs.UnsupportedFileSystemException No FileSystem for scheme "s3")
我已经包括在内了 /hadoop-3.3.0/share/hadoop/tools/lib
在 HADOOP_CLASSPATH
,还将aws相关jar复制到 apache-hive-metastore-3.0.0-bin/lib
. 还缺什么?
1条答案
按热度按时间4si2a6ki1#
终于弄明白了。首先(正如我之前提到的)我必须包括
hadoop/share/hadoop/tools/lib
在HADOOP_CLASSPATH
. 然而,两者都没有改变HADOOP_CLASSPATH
从工具中复制特定文件到公共文件对我来说也不管用。然后我切换到hadoop-2.7.7,它成功了。另外,我还得把Jackson的jar从工具里复制到普通的jar里。我的hadoop/etc/hadoop/core-site.xml
看起来像这样:在这一点上,您应该能够:
hadoop fs -ls s3a://{bucket}/