HDFS 在集群模式下使用Java读取保存在本地的Spark中的CSV文件

np8igboo 于 2022-12-09 发布在 HDFS

关注(0)|答案(1)|浏览(223)

我尝试读取保存在UNIX本地文件系统中的CSV文件，但在集群模式下运行时，找不到CSV文件。
在本地模式下，它可以读取HDFS和file：///文件，但在集群模式下，它只能读取HDFS文件。
有没有合适的方法来读取而不复制到HDFS？

来源：https://stackoverflow.com/questions/69571225/read-csv-file-in-spark-kept-in-local-using-java-in-cluster-mode

1条答案

按热度按时间

请记住，执行者需要能够访问文件，因此您必须从执行者节点处表明立场。正如您提到的HDFS，这意味着执行者节点必须能够访问您的HDFS集群。
如果您希望Spark集群访问本地文件，请考虑NFS/SMB等。但是，某些东西最终会复制数据。
如果您对您的体系结构添加更多详细信息，我可以更新我的答案。

赞(0）回复(0）举报 2022-12-09

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 5个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 5个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 5个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 5个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 5个月前