如何读取spark中没有标题的配置单元表

pod7payv 于 2021-06-25 发布在 Hive

关注(0)|答案(1)|浏览(425)

我试图阅读一个Hive表在pyspark，但我得到的标题以及我不想要的。
文件.csv

Id,Name
1,A
2,B
3,C
4,D

Hive表
我建立Hive表 tblproperties("skip.header.line.count"="1") 在hive中，我得到的数据是正确的，所以hive没有问题。
当我在Pypark中阅读这张表时，我面临着这个问题。

Hive apache-spark pyspark Header

来源：https://stackoverflow.com/questions/60848808/how-to-read-hive-table-in-spark-without-header

1条答案

按热度按时间

7vhp5slm1#

有Spark-11374吉拉报告了这一问题，并关闭了 won't fix .
可能的方法有： 1.You can directly read the HDFS file:spark.read.option("header","true").option("delimiter",",").csv("<hdfs_path>").show()2.using hive query: ```
spark.sql("select * from <table_name> where <col_name1> != 'id'").show()

赞(0）回复(0）举报 2021-06-26

我来回答

如何读取spark中没有标题的配置单元表

1条答案

相关问题

热门标签

最新问答