Introducción a Glusterfs (sistema de archivos) e instalación en RHEL/CentOS y Fedora

Introducción a Glusterfs (sistema de archivos) e instalación en RHEL/CentOS y Fedora

Estamos viviendo en un mundo donde los datos están creciendo de una manera impredecible y nuestra necesidad de almacenar estos datos, ya sea estructurado o no estructurado, de manera eficiente. Los sistemas informáticos distribuidos ofrecen una amplia gama de ventajas sobre los sistemas informáticos centralizados. Aquí los datos se almacenan de manera distribuida con varios nodos como servidores.

Almacenamiento de Glusterfs

El concepto de un servidor de metadatos ya no se necesita en un sistema de archivos distribuido. En los sistemas de archivos distribuidos, ofrece un punto de vista común de todos los archivos separados entre diferentes servidores. Se accede a archivos/directorios en estos servidores de almacenamiento de manera normal.

Por ejemplo, los permisos para archivos/directorios se pueden establecer como en el modelo de permiso del sistema habitual, I.mi. el propietario, el grupo y otros. El acceso al sistema de archivos básicamente depende de cómo el protocolo particular esté diseñado para funcionar en el mismo.

¿Qué es Glusterfs??

Glusterfs es un sistema de archivos distribuido definido para usarse en el espacio de usuario, yo.mi. Sistema de archivos en el espacio de usuario (FUSIBLE). Es un sistema de archivos basado en software que cuenta a su propia función de flexibilidad.

Mire la siguiente figura que representa esquemáticamente la posición de Glusterfs en un modelo jerárquico. Por defecto, el protocolo TCP será utilizado por Glusterfs.

Diseño de glusterfs

Ventajas a Glusterfs

  1. Innovación - Elimina los metadatos y puede mejorar dramamente el rendimiento que nos ayudará a unificar datos y objetos.
  2. Elasticidad - Adaptado al crecimiento y reducción del tamaño de los datos.
  3. Escalar linealmente - Tiene disponibilidad para petabytes y más allá.
  4. Sencillez - Es fácil de administrar e independiente del kernel mientras se ejecuta en el espacio de usuario.

¿Qué hace que Gluster sobresaliente entre otros sistemas de archivos distribuidos??

  1. Vendible - La ausencia de un servidor de metadatos proporciona un sistema de archivos más rápido.
  2. Asequible - Se implementa en hardware de productos básicos.
  3. Flexible - Como dije anteriormente, Glusterfs es un sistema de archivos solo de software. Aquí los datos se almacenan en sistemas de archivos nativos como Ext4, XFS, etc.
  4. Fuente abierta - Actualmente, Red Hat Inc, una compañía de código abierto de miles de millones de dólares mantiene a GLUTERFS, como parte de Red Hat Storage.

Conceptos de almacenamiento en Glusterfs

  1. Ladrillo - Brick es básicamente cualquier directorio que esté destinado a compartirse entre el grupo de almacenamiento de confianza.
  2. Grupo de almacenamiento de confianza - es una colección de estos archivos/directorios compartidos, que se basan en el protocolo diseñado.
  3. Almacenamiento de bloques - Son dispositivos a través de los cuales los datos se mueven a través de los sistemas en forma de bloques.
  4. Grupo - En Red Hat Storage, tanto el clúster como el grupo de almacenamiento de confianza transmiten el mismo significado de colaboración de los servidores de almacenamiento basado en un protocolo definido.
  5. Sistema de archivos distribuido - Un sistema de archivo en el que los datos se extienden en diferentes nodos donde los usuarios pueden acceder al archivo sin conocer la ubicación real del archivo. El usuario no experimenta la sensación del acceso remoto.
  6. FUSIBLE - Es un módulo de kernel cargable que permite a los usuarios crear sistemas de archivos por encima del núcleo sin involucrar ninguno de los códigos del núcleo.
  7. glusterd - Glusterd es el Daemon de administración Glusterfs, que es la columna vertebral del sistema de archivos que se ejecutará durante todo el tiempo cuando los servidores estén en estado activo.
  8. Posix - La interfaz del sistema operativo portátil (POSIX) es la familia de estándares definidos por el IEEE como una solución a la compatibilidad entre los variantes Unix en forma de una interfaz programable de aplicación (API).
  9. REDADA - La variedad redundante de discos independientes (RAID) es una tecnología que brinda una mayor confiabilidad de almacenamiento a través de la redundancia.
  10. Subvolumen - Un ladrillo después de ser procesado por menos a un traductor.
  11. Traductor - Un traductor es ese código que realiza las acciones básicas iniciadas por el usuario desde el punto de montaje. Conecta uno o más sub volúmenes.
  12. Volumen - Un volumen es una colección lógica de ladrillos. Todas las operaciones se basan en los diferentes tipos de volúmenes creados por el usuario.
Diferentes tipos de volúmenes

Las representaciones de diferentes tipos de volúmenes y combinaciones entre estos tipos de volumen básico también se permiten como se muestra a continuación.

Volumen distribuido Volumen replicado Volumen a rayas
Volumen replicado distribuido

Representación de un volumen replicado distribuido.

Volumen replicado distribuido

Instalación de Glusterfs en Rhel/Centos y Fedora

En este artículo, instalaremos y configuraremos Glusterfs por primera vez para una alta disponibilidad de almacenamiento. Para esto, estamos tomando dos servidores para crear volúmenes y replicar datos entre ellos.

Paso: 1 tengo al menos dos nodos

  1. Instalar Centos 6.5 (o cualquier otro sistema operativo) en dos nodos.
  2. Establecer nombres de host llamado "servidor 1" y "servidor2".
  3. Una conexión de red que funciona.
  4. Disco de almacenamiento en ambos nodos llamados "/datos/ladrillo".

Paso 2: Habilitar el repositorio de Epel y Glusterfs

Antes de instalar Glusterfs en ambos servidores, necesitamos habilitar Epel y Glusterfs repositorios para satisfacer dependencias externas. Use el siguiente enlace para instalar y habilitar el repositorio EPEL en ambos sistemas.

  1. Cómo habilitar el repositorio de Epel en Rhel/Centos

A continuación, necesitamos habilitar el repositorio de Glusterfs en ambos servidores.

# wget -p /etc /yum.repositar.d http: // descargar.gluster.org/pub/gluster/glusterfs/último/epel.Repo/Glusterfs-Epel.repositorio

Paso 3: Instalación de Glusterfs

Instale el software en ambos servidores.

# yum instalar glusterfs-server

Iniciar el demonio de gestión de glusterfs.

# Servicio Glusterd Start

Ahora verifique el estado de Daemon.

# Servicio de estado Glusterd
Salida de muestra
Servicio Glusterd Start Service Glusterd Status Glusterd.Servicio - LSB: servidor Glusterfs Cargado: cargado (/etc/rc.d/init.D/Glusterd) Active: Active (Running) desde el lunes 13 de agosto de 2012 13:02:11 -0700; Proceso de hace 2S: 19254 execstart =/etc/rc.d/init.D/Glusterd Start (Code = Exited, Status = 0/Success) Cgroup: name = systemd:/system/glusterd.Servicio ├ 19260/usr/sbin/glusterd -p/run/glusterd.PID ├ 19304/usr/sbin/glusterfsd --xlator-option georep-server.Listen -Port = 24009 -S Localhost… └ 19309/usr/sbin/glusterfs -f/var/lib/glusterd/nfs/nfs -server.vol -p/var/lib/glusterd/… 

Paso 4: Configurar Selinux e iptables

Abierto '/etc/sysconfig/selinux'Y cambie Selinux a cualquiera de los dos "permisivo" o "desactivado"Modo en ambos servidores. Guarde y cierre el archivo.

# Este archivo controla el estado de Selinux en el sistema. # Selinux = puede tomar uno de estos tres valores: # Eforce - Se aplica la política de seguridad de Selinux. # Permisivo - Selinux imprime advertencias en lugar de hacer cumplir. # Desactivado: no se carga la política de Selinux. Selinux = discapacitado # Selinuxtype = puede tomar uno de estos dos valores: # dirigidos - Los procesos dirigidos están protegidos, # MLS - Protección de seguridad de nivel múltiple. Selinuxtype = objetivo

A continuación, enjuague los iptables en ambos nodos o necesite permitir el acceso al otro nodo a través de iptables.

# iptables -f

Paso 5: Configure el grupo de confianza

Ejecute el siguiente comando en 'Servidor 1'.

Gluster Peer Probe Server2

Ejecute el siguiente comando en 'Servidor2'.

Gluster Peer Probe Server1

Nota: Una vez que este grupo ha sido conectado, solo los usuarios de confianza pueden investigar nuevos servidores en este grupo.

Paso 6: Configure un volumen de Glusterfs

En ambos servidor 1 y servidor2.

# Mkdir/Data/Brick/GV0

Crear un volumen en cualquier servidor único e iniciar el volumen. Aquí, he tomado 'Servidor 1'.

# volumen de gluster crea gv0 réplica 2 servidor1:/data/brick1/gv0 servidor2:/data/brick1/gv0 # gluster volumen inicio gv0

A continuación, confirme el estado del volumen.

# Información de volumen de Gluster

Nota: Si no se inicia el volumen en el caso, los mensajes de error se registran en '/var/log/glusterfs'En uno o ambos los servidores.

Paso 7: Verificar el volumen de Glusterfs

Monte el volumen a un directorio debajo '/MNT'.

# montar -t glusterfs servidor1: /gv0 /mnt

Ahora puede crear, editar archivos en el punto de montaje como una vista única del sistema de archivos.

Características de Glusterfs

  1. Auto curación - Si alguno de los ladrillos en un volumen replicado está inactivo y los usuarios modifican los archivos dentro del otro ladrillo, el demonio automático de autocuración entrará en acción tan pronto como el ladrillo esté arriba y las transacciones ocurridas durante el tiempo de inactividad se sincronizan respectivamente.
  2. Reequilibrio - Si agregamos un nuevo ladrillo a un volumen existente, donde residían una gran cantidad de datos, podemos realizar una operación de reequilibrio para distribuir los datos entre todos los ladrillos, incluido el ladrillo recién agregado.
  3. Geo replicación - Proporciona copias de seguridad de datos para la recuperación de desastres. Aquí viene el concepto de volúmenes maestros y esclavos. De modo que si el maestro está en total de los datos a través de esclavo. Esta característica se utiliza para sincronizar datos entre servidores separados geográficamente. La inicialización de una sesión de geo replicación requiere una serie de comandos Gluster.

Aquí, está el siguiente agarre de pantalla que muestra el módulo Geo-Repplication.

Replicación geo

Enlaces de referencia

Página de inicio de Glusterfs

Eso es todo por ahora!. Manténgase actualizado para la descripción detallada de características como la autocuración y el reequilibrio, la replicación geográfica, etc. en mis próximos artículos.