import spark.sqlContext.implicits._在scala中是如何工作的？

puruo6ea 于 2023-04-21 发布在 Scala

关注(0)|答案(1)|浏览(138)

我是Scala的新手
我想弄明白的是
这段代码给了我RDD[Int]，而不是给出使用toDF的选项

var input = spark.sparkContext.parallelize(List(1,2,3,4,5,6,7,8,9))

但是当我导入import spark.sqlContext.implicits._时，它提供了一个使用toDF的选项

import spark.sqlContext.implicits._
var input = spark.sparkContext.parallelize(List(1,2,3,4,5,6,7,8,9)).toDF

所以我查看了源代码，implicits在SQLContext类中是object。我不明白，为什么RDD示例在导入后能够调用toDF？
有人能帮我理解吗？
更新
在SQLContext类中的代码段下面找到
https://github.com/apache/spark/blob/master/sql/core/src/main/scala/org/apache/spark/sql/SQLContext.scala

object implicits extends SQLImplicits with Serializable {
    protected override def _sqlContext: SQLContext = self
  }

scala

来源：https://stackoverflow.com/questions/76034393/how-import-spark-sqlcontext-implicits-works-in-scala

1条答案

按热度按时间

km0tfn4u1#

toDF是一个扩展方法。通过导入，您可以将必要的隐式带入作用域。
例如，Int没有方法foo

1.foo() // doesn't compile

但如果定义扩展方法并隐式导入

object implicits {
  implicit class IntOps(i: Int) {
    def foo() = println("foo")
  }
}

import implicits._
1.foo() // compiles

编译器将1.foo()转换为new IntOps(1).foo()。
同样地

object implicits extends SQLImplicits ...

abstract class SQLImplicits ... {
  ...

  implicit def rddToDatasetHolder[T : Encoder](rdd: RDD[T]): DatasetHolder[T] = {
    DatasetHolder(_sqlContext.createDataset(rdd))
  }

  implicit def localSeqToDatasetHolder[T : Encoder](s: Seq[T]): DatasetHolder[T] = {
    DatasetHolder(_sqlContext.createDataset(s))
  }
}

case class DatasetHolder[T] private[sql](private val ds: Dataset[T]) {

  def toDS(): Dataset[T] = ds

  def toDF(): DataFrame = ds.toDF()

  def toDF(colNames: String*): DataFrame = ds.toDF(colNames : _*)
}

import spark.sqlContext.implicits._将spark.sparkContext.parallelize(List(1,2,3,4,5,6,7,8,9)).toDF转换为rddToDatasetHolder(spark.sparkContext.parallelize...).toDF，即DatasetHolder(_sqlContext.createDataset(spark.sparkContext.parallelize...)).toDF。
你可以在Scala中读到隐式和扩展方法
Understanding implicit in Scala
Where does Scala look for implicits?
Understand Scala Implicit classes
https://docs.scala-lang.org/overviews/core/implicit-classes.html
https://docs.scala-lang.org/scala3/book/ca-extension-methods.html
https://docs.scala-lang.org/scala3/reference/contextual/extension-methods.html
How extend a class is diff from implicit class?
关于spark.implicits._
Importing spark.implicits._ in scala
What is imported with spark.implicits._?
import implicit conversions without instance of SparkSession
Workaround for importing spark implicits everywhere
Why is spark.implicits._ is embedded just before converting any rdd to ds and not as regular imports?

赞(0）回复(0）举报 2023-04-21

我来回答

import spark.sqlContext.implicits._在scala中是如何工作的？

1条答案

相关问题

热门标签

最新问答