Parquet地板入口示例(所有入口都有 is_active_entity
为真)
{
"is_active_entity": true,
"is_removed": false
}
显示所有值的查询被视为null
select $1:IS_ACTIVE_ENTITY::boolean, count(*) from @practitioner_delta_stage/part-00000-49224c02-150b-493b-8036-54ab30a8ff40-c000.snappy.parquet group by $1:IS_ACTIVE_ENTITY::boolean ;
输出只有一个null组
$1:IS_ACTIVE_ENTITY::BOOLEAN COUNT(*)
NULL 4930277
我不知道哪里出了问题,spark在parquet中编写了正确的模式,从示例中可以明显看出,但snowflake将其视为null。
我该怎么解决这个问题?
1条答案
按热度按时间xfb7svmp1#
文件中的列被引用。因此
"is_active_entity"
是不一样的"IS_ACTIVE_ENTITY"
请尝试此查询:select $1:is_active_entity::boolean, count(*) from @practitioner_delta_stage/part-00000-49224c02-150b-493b-8036-54ab30a8ff40-c000.snappy.parquet group by $1:IS_ACTIVE_ENTITY::boolean ;
更多信息:https://docs.snowflake.com/en/sql-reference/identifiers-syntax.html#:~:text=20标识符%20区分大小写。