我成功地配置了到azuredatabricks集群的连接,并且可以使用
conn <- odbcConnect("AzureDatabricks")
sqlQuery(conn, "SELECT * FROM my_table")
但我需要访问Parquet文件。在databricks中,我可以使用以下代码:
%sql
Select * FROM parquet.`/path/to/folder`
如果我试试这个
sqlQuery(conn, "Select * FROM parquet.`/path/to/folder`")
我收到错误:
[Simba][SQLEngine] Table or view not found: SPARK.parquet./path/to/folder"
[RODBC] ERROR: Could not SQLExecDirect 'Select * FROM parquet.`/path/to/folder`
有没有办法通过rodbc访问Parquet文件?
1条答案
按热度按时间pod7payv1#
由于sql查询本身出错,您遇到了此问题。当你跑的时候
Select * FROM parquet./path/to/folder
,由于语法错误,您将看不到表或视图。示例:了解问题的示例(当您运行select*from parquer'somepath'),您将看到语法错误。
注意:从parquet文件创建dataframe之后,必须将其注册为临时表才能对其运行sql查询。
reference:spark sql 指南-Parquet文件