Installation de HBASE Zookeeper sur Archlinux
Si vous avez suivi et réussi les tutoriels précédants, HADOOP et HIVE, nul doute que vous trouverez celui-ci plus sympa, car plus court.
HBase, encore une autre base de données sur HDFS. Quelle est donc sa particularité ? Elle profite tout simplement d'une architecture en colonne, tout comme une architecture horizontale. Elle s'étend d'elle-même en profitant du vaste espace offert et géré par HDFS. Du coup, pas de verticalité. L'accès aux données se fait par bloc de famille, matérialisé par des paires clef/valeur datées.
HBASE n'est pas seul, car il s'appuie sur ZOOKEEPER, créé pour maintenir la coordination et la synchronisation au sein d’un cluster Hadoop. Nous allons donc voir l'installation et la configuration de ces deux services, dans l'espace de l'utilisateur hadoop déjà ouvert et configuré.
HBASE a besoin du langage ruby pour fonctionner en shell, de fait il nous faudra d'abord installer ce composant sur notre architecture ARCH. S'assurer d'être authentifié sous l'utilisateur hadoop puis ;
sudo pacman -S ruby
Dès l'installation de ruby terminée, téléchargement et décompression de HBASE
wget http://apache.mirror.gtcomm.net/hbase/stable/hbase-1.4.9-bin.tar.gz
tar -zxvf hbase-1.4.9-bin.tar.gz
Un lien symbolique pour simplifier l'accès
ln -s /home/hadoop/hbase-1.4.9/ ~/hbase
Un tour dans bashrc pour configurer $PATH et la variable d'environnement
nano .bashrc
# Set HBASE_HOME
export HBASE_HOME=/home/hadoop/hbase
export PATH=$PATH:$HBASE_HOME/bin
HBASE a besoin de l'emplacement de JAVA pour fonctionner
nano ~/hbase/conf/hbase-env.sh
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk
Puis nous pointerons vers le port HDFS (9000) dans la configuration site, et vers zookeeper ;
nano ~/hbase/conf/hbase-site.xml
<configuration>
<property>
<name>hbase.rootdir</name>
<value>hdfs://localhost:9000/hbase</value>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/home/hadoop/zookeeper</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
</configuration>
Avec un ifconfig, nous pouvons constuire l'adresse web http://<adresse_ip>:16010 afin de pouvoir voir nos tables et leur contenu.
Il nous reste plus que ZOOKEEPER à installer.
wget -c http://www-eu.apache.org/dist/zookeeper/stable/zookeeper-3.4.14.tar.gz
tar -zxvf zookeeper-3.4.14.tar.gz
ln -s /home/hadoop/zookeeper-3.4.14/ ~/zookeeper
et un répertoire de données à créer
mkdir zookeeper/data
La configuration ? très simple pour une fois
cp zookeeper/conf/zoo_sample.cfg zookeeper/conf/zoo.cfg
nano zookeeper/conf/zoo.cfg
Trouver : dataDir=/tmp/zookeeper
Remplacer par : dataDir=data
Pas de variable d'environnement cette fois, HBASE s'occupe de tout. On va juste ajouter le chemin à la variable $PATH
nano .bashrc
export PATH=$PATH:~/zookeeper/bin
C'est déjà fini ! Il ne reste plus qu'à lancer hbase et profiter de son shell, sans oublier de sourcer bashrc au préalable
source .bashrc
start-hbase.sh
hbase shell
Auteur : Michael Nandzik
Commentaires
Enregistrer un commentaire