这篇博客将由简入繁,入门HBase,将介绍Hbase的特点、架构、应用场景、集群搭建、HA设计等。
海量、稀疏(存储,查询有优势)、高并发、面向列、数据多版本、实时处理(spark、storm、stream)
系型数据库都是行存储,而Hbase是列存储,同一种数据在同一个块上
集群类型:
版本:
apache、cloudera(CDH清晰、更安全性、兼容性、稳定性,支持Kerbos安全认证)
Ntp: Network Time Protocol
一个server,多个slave进行时间同步
yum install -y ntp
restrict 192.168.3.0 mask 255.255.255.0 nomodify notrap
logfile /var/log/ntpd.log
server ntp1.aliyun.com
server ntp2.aliyun.com
server ntp3.aliyun.com
server 127.0.0.1
fudge 127.0.0.1 stratum 10
同步时间(5~10分钟)
ntpdate -u ntp2.aliyun.com
开启时间服务器、查看时间、开机自启动
systemctl start ntpd
systemctl status ntpd
systemctl enable ntpd
slave配置:/etc/ntp.conf 配置master的ip地址
server 192.168.3.1
1个master,4个slave
前置条件:5台机器创建好hadoop用户,免密登录
mkdir /opt/software && chown -R hadoop:hadoop /opt
分发包并解压缩
scp jdk-8u144-linux-x64.tar.gz slave1:/opt/software
su hadoop
tar -zxvf jdk-8u144-linux-x64.tar.gz
tar -zxvf hadoop-2.6.0-cdh5.14.2.tar.gz
export JAVA_HOME=/opt/software/jdk1.8.0_144
export HADOOP_HOME=/opt/software/hadoop
export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$HADOOP_HOME/lib
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
生效配置
. .bashrc
scp -r hadoop slave1:/opt/software/
scp .bashrc slave1:~
hadoop namenode -format
启动hdfs,查看集群状态
start-dfs.sh
jps
jps master有 Jps NameNode SecondNameNode
jps slave有jsp Datanode
启动yarn,查看集群状态
start-yarn.sh
jps master看到多了 ResourceManager
jps slave多了NodeManager
表示搭建完成
可用于:高可用、注册中心、分布式锁实现;
tar -zxvf zookeeper-3.4.5-cdh5.14.2.tar.gz
mv zookeeper-3.4.5-cdh5.14.2 zookeeper
cp zoo_sample.cfg zoo.cfg
dataDir=/opt/zookeeper/data
dataLogDir=/opt/zookeeper/logs
server.1=slave2:2888:3888
server.2=slave3:2888:3888
server.3=slave4:2888:3888
mkdir -p /opt/zookeeper/data
mkdir -p /opt/zookeeper/logs
cd /opt/software/data
vim myid
1
:wq
scp -r zookeeper slave3:/opt/software/
vi .bashrc
export JAVA_HOME=/opt/software/jdk1.8.0_144
export ZOO_HOME=/opt/software/zookeeper
export HADOOP_HOME=/opt/software/hadoop
export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$HADOOP_HOME/lib:$ZOO_HOME/lib
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$ZOO_HOME/bin
scp .bashrc slave3:~
. .bashrc
zkServer.sh start
zkServer.sh status
俩个HMaster,4个RegionServer,一个zookeeper。保证一个HMaster挂了,另一个补上,还能进行RegionServer故障节点的数据平衡等;
版权说明 : 本文为转载文章, 版权归原作者所有 版权申明
原文链接 : https://blog.csdn.net/qq_40985985/article/details/118945484
内容来源于网络,如有侵权,请联系作者删除!