hbase(导入数据)

33qvvth1  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(368)

我是hadoop和hbase的新手。我有这样的数据
客户ID,特征,计数,iav,3 ,xyz,3 bcd,iav,4 bcd,ter,4
我想通过api、批量导入(记录大小超过800mil)或pig读取这些数据,并在hbase中显示为(转置)
custid,iav,xyz,ter,3,3,空bcd,4,空,4
数据以hdfs格式显示。我该怎么做呢。我很感激你的指导。作为新人,我没能做太多。我基本上是Pig和Hive的那种人。
谢谢,

w8biq8rn

w8biq8rn1#

从这里开始
hadoop生态系统包含很多子项目。hbase和pig只是其中的一部分。
hbase是hadoop数据库,允许以表方式而不是文件方式管理数据。
pig是一种脚本语言,它将动态生成map reduce作业以获取所需的数据。与手写Map相比,它非常紧凑。

相关问题