如何在Python中从HDFS读取shapefile(.shp)

yvt65v4c  于 2023-04-18  发布在  HDFS
关注(0)|答案(1)|浏览(236)

我想知道我是否可以在Python中从HDFS读取shapefile。
如果有人能告诉我怎么做我会很感激的。
我尝试使用pyspark包。但我认为它不支持shapefile格式。

from pyspark.sql import SparkSession

# Create SparkSession
spark = SparkSession.builder.appName("read_shapefile").getOrCreate()

# Define HDFS path to the shapefile
hdfs_path = "hdfs://<namenode-ip>:<port>/<path>/<file.shp>"

# Read shapefile as Spark DataFrame
df = spark.read.format("shapefile").load(hdfs_path)
oymdgrw7

oymdgrw71#

检查此修改是否有效:

shapefile_df = spark.read \
              .format("com.esri.spark.shape") \
              .load("hdfs://<HDFS_HOST>:<HDFS_PORT>/<PATH_TO_SHAPEFILE>")

相关问题