使用pyspark的hivejdbc连接将列名作为行值返回

fcwjkofz 于 2021-06-24 发布在 Hive

关注(0)|答案(0)|浏览(322)

我正在使用pyspark连接到hive并获取一些数据。问题是它返回的所有行的值都是列名。它正在返回正确的列名。只有行值不正确。
这是我的密码

hive_jar_path="C:Users/shakir/Downloads/ClouderaHiveJDBC-2.6.11.1014/ClouderaHiveJDBC-2.6.11.1014/ClouderaHiveJDBC42-2.6.11.1014/HiveJDBC42.jar"
print(hive_jar_path)
print("")

import os
os.environ["HADOOP_HOME"]="c:/users/shakir/downloads/spark/spark/spark"
import os
os.environ["SPARK_HOME"]="c:/users/shakir/downloads/spark/spark/spark"
import findspark
findspark.init()

from pyspark import SparkContext, SparkConf, SQLContext
from pyspark.sql import SparkSession

import uuid
spark = SparkSession \
    .builder \
    .appName("Python Spark SQL Hive integration example") \
    .config("spark.sql.warehouse.dir", "hdfs://...../user/hive/warehouse/..../....")

spark.config("spark.driver.extraClassPath", hive_jar_path)
spark.config("spark.sql.hive.llap", "true")
spark.config("spark.sql.warehouse.dir", "hdfs://...../user/hive/warehouse/..../....")

spark=spark.enableHiveSupport().getOrCreate()

import databricks.koalas as ks

print("Reading Data from Hive . . .")
options={
    "fetchsize":1000,
    "inferSchema": True,
    "fileFormat":"orc",
    "inputFormat":"org.apache.hadoop.hive.ql.io.orc.OrcInputFormat",
    "outputFormat":"org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat",
    "driver":"org.apache.hive.jdbc.HiveDriver",
    }
df = ks.read_sql("SELECT * FROM PERSONS LIMIT 3", connection_string,options=options)
print("Done")
print(df)

代码输出：

+------+-----+---------+
| Name | Age | Address |
+------+-----+---------+
| Name | Age | Address |
+------+-----+---------+
| Name | Age | Address |
+------+-----+---------+
| Name | Age | Address |
+------+-----+---------+

Hive pyspark apache-spark-sql spark-koalas hiveql

来源：https://stackoverflow.com/questions/65338282/hive-jdbc-connection-using-pyspark-returns-column-names-as-row-values

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

使用pyspark的hivejdbc连接将列名作为行值返回

暂无答案！

相关问题

热门标签

最新问答