使用spark 2.4从azure data lake storage v2读取文件

afdcj2ne 于 2021-05-27 发布在 Spark

关注(0)|答案(1)|浏览(508)

我正在尝试读取一个简单的csv文件azuredatalakestoragev2和spark2.4在我的intellijide上的mac
下面的代码

package com.example

import org.apache.spark.SparkConf
import org.apache.spark.sql._

object Test extends App {

  val appName: String = "DataExtract"
  val master: String = "local[*]"
  val sparkConf: SparkConf = new SparkConf()
    .setAppName(appName)
    .setMaster(master)
    .set("spark.scheduler.mode", "FAIR")
    .set("spark.sql.session.timeZone", "UTC")
    .set("spark.sql.shuffle.partitions", "32")
    .set("fs.defaultFS", "abfs://development@xyz.dfs.core.windows.net/")
    .set("fs.azure.account.key.xyz.dfs.core.windows.net", "~~key~~")

  val spark: SparkSession = SparkSession
    .builder()
    .config(sparkConf)
    .getOrCreate()
  spark.time(run(spark))

def run(spark: SparkSession): Unit = {

  val df = spark.read.csv("abfs://development@xyz.dfs.core.windows.net/development/sales.csv")
  df.show(10)

}

}

它能够读取，并引发安全异常

Exception in thread "main" java.lang.NullPointerException
    at org.wildfly.openssl.CipherSuiteConverter.toJava(CipherSuiteConverter.java:284)
    at org.wildfly.openssl.OpenSSLEngine.toJavaCipherSuite(OpenSSLEngine.java:1094)
    at org.wildfly.openssl.OpenSSLEngine.getEnabledCipherSuites(OpenSSLEngine.java:729)
    at org.wildfly.openssl.OpenSSLContextSPI.getCiphers(OpenSSLContextSPI.java:333)
    at org.wildfly.openssl.OpenSSLContextSPI$1.getSupportedCipherSuites(OpenSSLContextSPI.java:365)
    at org.apache.hadoop.fs.azurebfs.utils.SSLSocketFactoryEx.<init>(SSLSocketFactoryEx.java:105)
    at org.apache.hadoop.fs.azurebfs.utils.SSLSocketFactoryEx.initializeDefaultFactory(SSLSocketFactoryEx.java:72)
    at org.apache.hadoop.fs.azurebfs.services.AbfsClient.<init>(AbfsClient.java:79)
    at org.apache.hadoop.fs.azurebfs.AzureBlobFileSystemStore.initializeClient(AzureBlobFileSystemStore.java:817)
    at org.apache.hadoop.fs.azurebfs.AzureBlobFileSystemStore.<init>(AzureBlobFileSystemStore.java:149)
    at org.apache.hadoop.fs.azurebfs.AzureBlobFileSystem.initialize(AzureBlobFileSystem.java:108)

谁能帮帮我，怎么了？

scala apache-spark Azure azure-data-lake-gen2

来源：https://stackoverflow.com/questions/63195365/reading-file-from-azure-data-lake-storage-v2-with-spark-2-4

1条答案

按热度按时间

mw3dktmi1#

根据我的研究，当您的jar与hadoop版本不兼容时，您将收到此错误消息。
请您仔细检查以下问题：
http://mail-archives.apache.org/mod_mbox/spark-issues/201907.mbox/%3cjira.13243325.1562321895000.591499.1562323440292@atlassian.jira%3e
https://issues.apache.org/jira/browse/hadoop-16410

赞(0）回复(0）举报 2021-05-27

我来回答

使用spark 2.4从azure data lake storage v2读取文件

1条答案

相关问题

热门标签

最新问答