如何从hdfs中删除客户信息

yruzcnhs 于 2021-06-25 发布在 Hive

关注(0)|答案(1)|浏览(649)

假设，我今天有几个客户，所以我要存储他们的信息，如customer\u id、customer\u name、customer\u emailid等。如果我的客户要离开，他希望从我的hdfs中删除他的个人信息。
所以我有以下两种方法来达到同样的效果。
方法1：
1.在hdfs上创建内部表
2.使用过滤逻辑从第一个表创建外部表
3.在创建第二个表时，对特定列应用自定义项以进行更多列筛选
方法2：
spark=>读取、过滤、写入
还有别的解决办法吗？

Hive hdfs data-warehouse hdfstore

来源：https://stackoverflow.com/questions/61358516/how-to-delete-customer-information-from-hdfs

1条答案

按热度按时间

kx5bkwkv1#

方法2在配置单元中是可能的-选择、筛选、写入
在hdfs中的目录顶部创建一个表（外部的或托管的，在这个上下文中无关紧要，如果以后要删除表并保持数据的原样，最好是外部的）。从select with filter插入覆盖表或分区。

insert overwrite mytable 
select *                       
 from mytable --the same table
where customer_id not in (...) --filter rows

赞(0）回复(0）举报 2021-06-26

我来回答

如何从hdfs中删除客户信息

1条答案

相关问题

热门标签

最新问答