无法使用sparksql在配置单元中写入数据

b4lqfgs4 于 2021-05-27 发布在 Hadoop

关注(0)|答案(3)|浏览(436)

我正在使用sparksql将数据从一个配置单元表加载到另一个配置单元表。我已经使用enablehivesupport创建了sparksession，并且可以使用sparksql在配置单元中创建表，但是当我使用sparksql将数据从一个配置单元表加载到另一个配置单元表时，我遇到了权限问题：
权限被拒绝：user=anonymous，access=write，path=“hivepath”。
我使用spark用户运行这个程序，但不明白为什么它使用匿名用户而不是spark。有人能建议我如何解决这个问题吗？
我正在使用下面的代码。

sparksession.sql("insert overwrite into table dbname.tablename" select * from dbname.tablename").

hadoop Hive apache-spark apache-spark-sql

来源：https://stackoverflow.com/questions/60721881/not-able-to-write-data-in-hive-using-sparksql

3条答案

按热度按时间

qv7cva1a1#

第一件事是，你可以尝试为同名用户

root@host:~# su - hdfs
hdfs@host:~$ hadoop fs -mkdir /user/anonymous
hdfs@host:~$ hadoop fs -chown anonymous /user/anonymous

一般来说
出口 HADOOP_USER_NAME=youruser 之前 spark-submit 会有用的。连同spark一起提交如下配置。 --conf "spark.yarn.appMasterEnv.HADOOP_USER_NAME=${HADDOP_USER_NAME}" \ 或者你可以尝试使用 sudo -su username spark-submit --class 你的班级
看到这个了吗
注意：这个用户名设置应该是您初始集群设置的一部分，理想情况下，如果它完成了，那么就不需要执行上面所有的操作，而且它看起来毫无意义。
我个人不喜欢用户名硬编码的代码，它应该从外面的Spark工作。

赞(0）回复(0）举报 2021-05-27

sycxhyv72#

要验证运行的用户，请运行以下命令：-

sc.sparkUser

它将向您显示当前用户，然后您可以尝试根据下面的代码设置新用户
在scala中，您可以通过

System.setProperty("HADOOP_USER_NAME","newUserName")

赞(0）回复(0）举报 2021-05-27

wljmcqd83#

如果您使用的是spark，则需要在spark上下文中设置用户名。

System.setProperty("HADOOP_USER_NAME","newUserName")
  val spark = SparkSession
    .builder()
    .appName("SparkSessionApp")
    .master("local[*]")
    .getOrCreate()

  println(spark.sparkContext.sparkUser)

赞(0）回复(0）举报 2021-05-27

我来回答

无法使用sparksql在配置单元中写入数据

3条答案

相关问题

热门标签

最新问答