使用BigQuery Spark连接器保存分区表

xghobddn 于 2023-01-05 发布在 Apache

关注(0)|答案(1)|浏览(127)

我想使用带有以下两个选项（partion by和require filter）的frompyspark创建一个表，但我看不到使用bigquery连接器执行此操作的选项
这就是我在BigQuery中的工作方式

CREATE dataset.table AS SELECT XXXX 
PARTITION BY
  DATE_TRUNC(collection_date, DAY) OPTIONS ( require_partition_filter = TRUE)

这是我通常做的

dataframe
        .write
        .format("bigquery")
        .mode(mode)
        .save(f"{dataset}.{table_name}")

apache-spark

来源：https://stackoverflow.com/questions/75012213/saving-partitioned-table-with-bigquery-spark-connector

1条答案

按热度按时间

2guxujil1#

您可以使用partitionField、datePartition、partitionType
用于群集-clusteredFields
查看更多选项：
https://github.com/GoogleCloudDataproc/spark-bigquery-connector#properties

赞(0）回复(0）举报 2023-01-05

我来回答

使用BigQuery Spark连接器保存分区表

1条答案

相关问题

热门标签

最新问答