我正在使用DSN将本地python连接到HDFS集群:
import pyodbc
with pyodbc.connect("DSN=CDH_HIVE_PROD", autocommit=True) as conn:
df = pd.read_sql("""Select * from table1""", conn)
df
我如何将这个表写回集群作为'table1tmp'?我是否需要一个create语句来首先创建这个表?然后我如何从一个panda Dataframe 中插入数据?
我假设这是一件经常做的事情,它应该是相当容易的(拉数据,做一些事情,保存数据回来),但我无法找到任何使用pyodbc或DSN的例子,这似乎是我唯一的连接方式。
1条答案
按热度按时间qzlgjiam1#
我们也遇到过类似的问题。多亏了关于SQLAlchemy的评论,我们找到了一个可行的解决方案: