我正在做两个像这样的 Impala 表。
表1:
| 已满警报|
| - -|
| xyz_访问亚利桑那州_xyz|
| klmthak_访问伦敦|
| 访问伊斯坦布尔|
| 参观巴黎|
表2:
| 仅名称|段|
| - -|- -|
| 亚利桑那州|一个|
| 伦敦|2个|
| 伊斯坦布尔|2个|
| 巴黎|2个|
我想做的是检查table 2中的only_name列,如果名称出现在table 1中的full_alert列上,则创建新列作为destination。table 1中的full_alert包含不同的结构,这就是我无法使用SUBSTR()的原因(我尝试过,发现了许多异常)
在Hive或 Impala 中可以这样做吗?
我尝试在Jupyter笔记本中进行此解析,但数据太大,每当我尝试运行查询时,都会得到空表或系统错误。
所需表:
| 已满警报|目的地|
| - -|- -|
| xyz_访问亚利桑那州_xyz|亚利桑那州|
| klmthak_访问伦敦|伦敦|
| 访问伊斯坦布尔|伊斯坦布尔|
| 参观巴黎|巴黎|
非常感谢您的支持。
1条答案
按热度按时间67up9zun1#
https://dbfiddle.uk/LqXXYYKI
我尝试了这两个查询,但我得到了一个语法错误。- Merve
Apache Impala实现了LOCATE()函数。
有可能它只是不接受数字输出作为逻辑值。