pyspark 错误执行器：阶段0.0(TID 0)/ 1]中的任务0.0出现异常,waitResult中抛出异常：

vmpqdwk3 于 2023-01-01 发布在 Spark

关注(0)|答案(1)|浏览(283)

我是新的pyspark和AWS。我试图读取数据从aws s3 pyspark版本3. 3. 0我尝试了这个：

from pyspark.sql import SparkSession
spark = SparkSession\
.builder\
.config('spark.master', 'local')\
.config('spark.app.name', 's3app')\
.config('spark.jars.packages', 'org.apache.hadoop:hadoop-aws:3.3.4,org.apache.hadoop:hadoop-common:3.3.4')\
.getOrCreate()
sc = spark.sparkContext
sc._jsc.hadoopConfiguration().set('fs.s3a.access.key', 'access-key')
sc._jsc.hadoopConfiguration().set('fs.s3a.secret.key', 'secret-key')
df = spark.read.format('parquet').load('s3a://path-to-s3')

我尝试了几乎所有关于“堆栈溢出”的解决方案，但没有一个对我有效。我得到了下面的error message，错误是代码的最后一行。

来源：https://stackoverflow.com/questions/73476280/error-executor-exception-in-task-0-0-in-stage-0-0-tid-0-1-org-apache-spark

1条答案

按热度按时间

此错误是由于存储桶的权限引起的，请检查您的IAM策略。

赞(0）回复(0）举报 2023-01-01

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 9个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 9个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 9个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 9个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 9个月前