我正在googlecolabs上测试apachespark命令,但是打印出来的表没有对齐。它在某些机器上看起来很好,但在某些机器上却不行。所以我想知道是否有人能帮助澄清为什么会发生这种情况。谢谢您!
dgtucam11#
spark可以像Pandas一样在jupyter笔记本上显示Dataframe。
spark.conf.set("spark.sql.repl.eagerEval.enabled",True)
您的Dataframe将显示为html表。
df = spark.read.option("header",True).csv("sample.csv") df.limit(10)
1条答案
按热度按时间dgtucam11#
spark可以像Pandas一样在jupyter笔记本上显示Dataframe。
您的Dataframe将显示为html表。