Installation de HBASE Zookeeper sur Archlinux


Si vous avez suivi et réussi les tutoriels précédants, HADOOP et HIVE, nul doute que vous trouverez celui-ci plus sympa, car plus court.

HBase, encore une autre base de données sur HDFS. Quelle est donc sa particularité ? Elle profite tout simplement d'une architecture en colonne, tout comme une architecture horizontale. Elle s'étend d'elle-même en profitant du vaste espace offert et géré par HDFS. Du coup, pas de verticalité. L'accès aux données se fait par bloc de famille, matérialisé par des paires clef/valeur datées.

HBASE n'est pas seul, car il s'appuie sur ZOOKEEPER, créé pour maintenir la coordination et la synchronisation au sein d’un cluster Hadoop. Nous allons donc voir l'installation et la configuration de ces deux services, dans l'espace de l'utilisateur hadoop déjà ouvert et configuré.

HBASE a besoin du langage ruby pour fonctionner en shell, de fait il nous faudra d'abord installer ce composant sur notre architecture ARCH. S'assurer d'être authentifié sous l'utilisateur hadoop puis ;

    sudo pacman -S ruby

Dès l'installation de ruby terminée, téléchargement et décompression de HBASE

    wget http://apache.mirror.gtcomm.net/hbase/stable/hbase-1.4.9-bin.tar.gz
    tar -zxvf hbase-1.4.9-bin.tar.gz


Un lien symbolique pour simplifier l'accès

    ln -s /home/hadoop/hbase-1.4.9/ ~/hbase

Un tour dans bashrc pour configurer $PATH et la variable d'environnement

    nano .bashrc
        # Set HBASE_HOME
        export HBASE_HOME=/home/hadoop/hbase
        export PATH=$PATH:$HBASE_HOME/bin


HBASE a besoin de l'emplacement de JAVA pour fonctionner

    nano ~/hbase/conf/hbase-env.sh
        export JAVA_HOME=/usr/lib/jvm/java-8-openjdk


Puis nous pointerons vers le port HDFS (9000) dans la configuration site, et vers zookeeper ;

    nano ~/hbase/conf/hbase-site.xml
        <configuration>
           <property>
              <name>hbase.rootdir</name>
              <value>hdfs://localhost:9000/hbase</value>
           </property>
           <property>
              <name>hbase.zookeeper.property.dataDir</name>
              <value>/home/hadoop/zookeeper</value>
           </property>
           <property>
             <name>hbase.cluster.distributed</name>
             <value>true</value>
           </property>
        </configuration>


Avec un ifconfig, nous pouvons constuire l'adresse web http://<adresse_ip>:16010 afin de pouvoir voir nos tables et leur contenu.

Il nous reste plus que ZOOKEEPER à installer.

    wget -c http://www-eu.apache.org/dist/zookeeper/stable/zookeeper-3.4.14.tar.gz
    tar -zxvf zookeeper-3.4.14.tar.gz
    ln -s /home/hadoop/zookeeper-3.4.14/ ~/zookeeper


et un répertoire de données à créer

    mkdir zookeeper/data

La configuration ? très simple pour une fois

    cp zookeeper/conf/zoo_sample.cfg zookeeper/conf/zoo.cfg
    nano zookeeper/conf/zoo.cfg
        Trouver : dataDir=/tmp/zookeeper
        Remplacer par : dataDir=data


Pas de variable d'environnement cette fois, HBASE s'occupe de tout. On va juste ajouter le chemin à la variable $PATH

    nano .bashrc
        export PATH=$PATH:~/zookeeper/bin


C'est déjà fini ! Il ne reste plus qu'à lancer hbase et profiter de son shell, sans oublier de sourcer bashrc au préalable

    source .bashrc
    start-hbase.sh
    hbase shell


Auteur : Michael Nandzik

Commentaires

Posts les plus consultés de ce blog

Installation de HIVE sur Archlinux

AJAX du point de vue PHP - PHP Route

Installation de Apache Spark sur Archlinux avec yaourt