我是hadoop和hbase的新手。我有这样的数据客户ID,特征,计数,iav,3 ,xyz,3 bcd,iav,4 bcd,ter,4我想通过api、批量导入(记录大小超过800mil)或pig读取这些数据,并在hbase中显示为(转置)custid,iav,xyz,ter,3,3,空bcd,4,空,4数据以hdfs格式显示。我该怎么做呢。我很感激你的指导。作为新人,我没能做太多。我基本上是Pig和Hive的那种人。谢谢,
w8biq8rn1#
从这里开始hadoop生态系统包含很多子项目。hbase和pig只是其中的一部分。hbase是hadoop数据库,允许以表方式而不是文件方式管理数据。pig是一种脚本语言,它将动态生成map reduce作业以获取所需的数据。与手写Map相比,它非常紧凑。
1条答案
按热度按时间w8biq8rn1#
从这里开始
hadoop生态系统包含很多子项目。hbase和pig只是其中的一部分。
hbase是hadoop数据库,允许以表方式而不是文件方式管理数据。
pig是一种脚本语言,它将动态生成map reduce作业以获取所需的数据。与手写Map相比,它非常紧凑。