如何基于配置创建spark连接str?

vvppvyoh  于 2021-05-27  发布在  Spark
关注(0)|答案(1)|浏览(417)

我有以下配置:databricks runtime version 5.5 lts(包括apachespark 2.4.3、scala 2.11)
它是Spark的正确连接线吗?我从来没有创造过。

  1. conn_str = "org.apache.spark:spark-avro_2.11:2.4.3,org.mongodb.spark:mongo-spark-connector_2.11:2.4.2"
  2. spark = (
  3. SparkSession.builder
  4. .config("spark.jars.packages", connection_str)
  5. .config("spark.ui.showConsoleProgress", False)
  6. .getOrCreate()
  7. )
cuxqih21

cuxqih211#

如果您使用的是databricks平台,那么 SparkSession 已在启动群集时初始化,安装包可能太晚。最好使用创建的集群中的libraries选项卡逐个安装这些库—使用 Maven 协调要安装的部件 org.apache.spark:spark-avro_2.11:2.4.3 以及 org.mongodb.spark:mongo-spark-connector_2.11:2.4.2 分开。有关详细信息,请参阅文档。

相关问题