在pyspark中创建模式的语法。
data.csv
id,name
1,sam
2,smith
val schema = new StructType().add("id", IntType).add("name", StringType)
val ds = spark.read.schema(schema).option("header", "true").csv("data.csv")
ds.show
在pyspark中创建模式的语法。
data.csv
id,name
1,sam
2,smith
val schema = new StructType().add("id", IntType).add("name", StringType)
val ds = spark.read.schema(schema).option("header", "true").csv("data.csv")
ds.show
1条答案
按热度按时间fjnneemd1#
使用structfield(name,datatype,nullable=true)定义structtype
从pyspark.sql.types可以导入数据类型