snowflake将parquet中的布尔值解释为null?

jutyujz0  于 2021-05-19  发布在  Spark
关注(0)|答案(1)|浏览(540)

Parquet地板入口示例(所有入口都有 is_active_entity 为真)

{
 "is_active_entity": true,
  "is_removed": false
}

显示所有值的查询被视为null

select  $1:IS_ACTIVE_ENTITY::boolean, count(*) from @practitioner_delta_stage/part-00000-49224c02-150b-493b-8036-54ab30a8ff40-c000.snappy.parquet group by $1:IS_ACTIVE_ENTITY::boolean ;

输出只有一个null组

$1:IS_ACTIVE_ENTITY::BOOLEAN    COUNT(*)
    NULL                                            4930277

我不知道哪里出了问题,spark在parquet中编写了正确的模式,从示例中可以明显看出,但snowflake将其视为null。
我该怎么解决这个问题?

xfb7svmp

xfb7svmp1#

文件中的列被引用。因此 "is_active_entity" 是不一样的 "IS_ACTIVE_ENTITY" 请尝试此查询: select $1:is_active_entity::boolean, count(*) from @practitioner_delta_stage/part-00000-49224c02-150b-493b-8036-54ab30a8ff40-c000.snappy.parquet group by $1:IS_ACTIVE_ENTITY::boolean ; 更多信息:https://docs.snowflake.com/en/sql-reference/identifiers-syntax.html#:~:text=20标识符%20区分大小写。

相关问题