azure 创建表时，方案将引用哪些Parquet文件数据库

vql8enpb 于 2023-01-18 发布在其他

关注(0)|答案(1)|浏览(119)

我使用下面的语法在ADLSParquet文件的顶部创建一个Azure数据库中的外部表。
创建表如果不存在<table_name>使用 parquet 位置'abfss：//@'
这个语法将自动推断出parquet文件的模式并创建外部表，现在我的问题是当指定位置有多个文件可用时（特别是当文件结构不同时），哪个文件数据库将引用？
最近的还是最老的还是随机的？

Azure

来源：https://stackoverflow.com/questions/75143347/which-parquet-file-databricks-will-refer-for-schema-while-creating-a-table

1条答案

按热度按时间

bxgwgixi1#

我已经复制了上面的结果，并得到了以下结果。
这是我的两个Parquet文件，模式不同，因为一个比另一个列少。

当我从文件夹创建表时，它只取了第一个文件，这意味着按字母顺序。

%sql
CREATE TABLE if not exists student1 USING parquet OPTIONS (path 'dbfs:/mnt/data/delta/');
select * from student1;

这与pyspark Dataframe 也是一样的。

赞(0）回复(0）举报 2023-01-18

我来回答

azure 创建表时，方案将引用哪些Parquet文件数据库

1条答案

相关问题

热门标签

最新问答