hbase1.2.1到dataframe

dy2hfwbg  于 2021-06-09  发布在  Hbase
关注(0)|答案(1)|浏览(201)

我在hbase(v-1.2.1)中有一个表,我想对它应用一些机器学习技术。因此,我想将我的表表单hbase加载到dataframe。

hbase(main):006:0> list
TABLE
cust_sms                                                              
1 row(s) in 0.0120 seconds
=> ["cust_sms"]
hbase(main):007:0>

表名为“cust\u sms”,hbase版本为1.2.1。我不能使用happybase,因为它只适用于hbase 0.9.x版本。
`

biswetbf

biswetbf1#

我已经编写了一个python包来在hbase中读写Dataframe。我很久没用过这个包裹了。不过你可以试试。github回购就在这里。pypi包在这里

import happybase
import numpy as np
import pandas as pd
import pdhbase as pdh
connection = None
try:
    connection = happybase.Connection('127.0.0.1')
    connection.open()
    df = pdh.read_hbase(connection, 'sample_table', 'df_key', cf='cf')
    print df
finally:
    if connection:
        connection.close()

相关问题