spark可以像hive一样读取alluxio的元数据吗

hujrc8aj 于 2021-05-29 发布在 Hadoop

关注(0)|答案(1)|浏览(643)

我试图通过使用alluxio来减少spark用于读写数据的时间。
但是我发现我必须指定读取数据的路径。
我发现我可以使用hive的metatool将hive的仓库从hdfs更改为alluxio，这样我就可以通过sparksql将数据写入alluxio。但我不知道如何用sql读取alluxio的数据。
有没有办法像hive一样读/写alluxio的数据？或许可以读取alluxio的元数据并将其添加到metastore？

hadoop apache-spark alluxio

来源：https://stackoverflow.com/questions/47819698/can-spark-read-alluxios-metadata-just-like-hive

1条答案

按热度按时间

ssgvzors1#

您所需要做的就是修改表 location 在 Spark 的元存储。
您可以查看alluxio以了解详细信息，如果表位置alter花费的时间太长，请查看此线程以获取帮助。
请注意，第一次查询该表时， Alluxio 将从ufs获取数据。数据存储在 Alluxio ，以后的表查询将直接从 Alluxio .

赞(0）回复(0）举报 2021-05-29

我来回答

spark可以像hive一样读取alluxio的元数据吗

1条答案

相关问题

热门标签

最新问答