我有以下配置:databricks runtime version 5.5 lts(包括apachespark 2.4.3、scala 2.11)
它是Spark的正确连接线吗?我从来没有创造过。
conn_str = "org.apache.spark:spark-avro_2.11:2.4.3,org.mongodb.spark:mongo-spark-connector_2.11:2.4.2"
spark = (
SparkSession.builder
.config("spark.jars.packages", connection_str)
.config("spark.ui.showConsoleProgress", False)
.getOrCreate()
)
1条答案
按热度按时间cuxqih211#
如果您使用的是databricks平台,那么
SparkSession
已在启动群集时初始化,安装包可能太晚。最好使用创建的集群中的libraries选项卡逐个安装这些库—使用Maven
协调要安装的部件org.apache.spark:spark-avro_2.11:2.4.3
以及org.mongodb.spark:mongo-spark-connector_2.11:2.4.2
分开。有关详细信息,请参阅文档。