我在开发环境中有一台linux(ubuntu)服务器,我计划在生产环境中也使用一台服务器。我有从nutch2.2.1生成的爬网数据,我想存储在hbase 0.90.6中。因为,我不打算使用多台机器(我只有一台服务器),在我的例子中,哪种模式的hbase最适合于production env-伪分布还是完全分布?
avkwfej41#
伪分布式模式更好,因为在独立模式下使用本地fs。这意味着您不能利用hdfs+mr组合提供的并行性。
1条答案
按热度按时间avkwfej41#
伪分布式模式更好,因为在独立模式下使用本地fs。这意味着您不能利用hdfs+mr组合提供的并行性。