Instalación de las celdasTopAdministración de UsuariosAlmacenamiento distribuido de Archivos

Almacenamiento distribuido de Archivos

Para cumplir con los requerimientos de uso de la red se requiere que:

  1. Cada usuario dispone de un directorio personal, al cual puede acceder desde cualquier estación de trabajo.
  2. Se pueden crear directorios compartidos entre grupos arbitrarios de usuarios, para compartir material educativo y/o para recolectar contribuciones de trabajos en grupos.
Además se supone, que hay protección de los datos contra pérdidas mediante un mecanismo de respaldos adecuado, que no requiere intervención de personal capacitados.

Al seleccionar un sistema de archivos distribuido se puede obtener inclusive otras funcionalidades:

Entre los sistemas de archivos distribuidos contamos con dos más conocidos:
AFS
Andrew Filesystem ttp://www.openafs.org/http://www.openafs.org/, que es más maduro y cuenta con soporte comercial, inclusive de IBM.
Coda
Filesystemttp://www.coda.cs.cmu.edu/http://www.coda.cs.cmu.edu/, que es más moderno y orientado hacia operación desconectada.
AFS requiere la operación de un servicio de autenticación Kerberos, que puede resultar en mayor inversión en configuración y administración. En la siguiente discusión se supone la selección de Coda como sistema a usar.

Existen dos nuevos sistemas emergentes: Odyssey - un sucesor de Coda optimiza sus operaciones en dependencia de las aplicaciones y formato de archivos que transporta, Intermezzo intenta hacer un énfasis en computación móvil y alta disponibilidad.

En una determinada computadora de una determinada red (red1) de una determinada institución (UNI) el directorio personal de un determinado usuario (user1) se presentaría de la siguiente forma:

/coda/uni.edu.ni/red1/home/user1
o con un otro ejemplo:
/coda/ni.mecd/rivas/escuela1/home/user1
Sin embargo, esta misma dirección aplica desde cualquier otra computadora, inclusive desde cualquier otra red.

Puesto los permisos de acceso apropiados se puede "trasladar" un estudiante de una escuela a otra con una simple operación de copiado:

copy /coda/ni.mecd/rivas/escuela1/home/user1 \

/coda/ni.mecd/sanjorge/escuela5/home/user8

(todo en una sola línea). Obviamente esta función puede realizarse con el explorador de Windows, ratón y "drag&drop".

Los sistemas de archivos distribuidos trabajan con "Access Control Lists" - ACL, en vez de permisos de usuarios y grupos, como conocido comúnmente en Unix.

Un usuario puede crear un directorio, y darle permiso de acceso a un grupo de usuarios arbitrariamente seleccionado, de la misma red y también de una red remota, sin intervención del usuario Administrador.

Terminales - tontos e inteligentes

Para los usuarios el uso de un sistema de archivos distribuidos es completamente transparente, en cuanto al manejo, con la salvedad, que si la estación de trabajo está en otra celda, o inclusive en otra red las operaciones (abrir, copiar, etc.) pueden tardar más tiempo de lo acostumbrado en un disco duro local.

Para la instalación se requiere, que cada computadora cuente con un programa "cliente", que se conecta al almacén "global" para obtener acceso a los archivos. Existen programas clientes para Linux (Unix) y para MS-Windows.

El almacén es formado por uno o varios "servidores" Coda (o AFS), que comparten entre ellos los directorios y archivos, y los ofrecen a los clientes, después de la debida autenticación del usuario.

Cada cliente requiere un espacio "cache" - de almacenamiento intermediario, para guardar localmente los archivos accedidos. Tomando en cuenta que un usuario trabaja en una estación de trabajo se podría suponer que un espacio temporal de 500 MB a un (1) GB puede ser suficiente. Este número se multiplica con la cantidad de computadoras por celda para obtener 2.5 GB a 5 GB en el disco duro del nodo a reservarse para los usuarios.

Nodos

Para aumentar la disponibilidad al máximo, cada nodo se configurará como Servidor Coda. Los servidores Coda son organizados en "Coda-Cells" , dentro de los cuales pueden duplicar su función de almacenamiento (respaldo/replica) o aumentar el espacio completo de almacenamiento disponible.

Los directorios personales de todos los usuarios de una red se distribuirán equitativamente entre las celdas. Preferiblemente un directorio de un usuario se ubica en las misma celdas donde accede la persona respectiva a un terminal.

Asumiendo la disposición de 10 GB de espacio "propio" por cada nodo (y un disco de 40 GB), se puede ofrecer un espacio de 10 MB de directorio personal a mil usuarios en una sola celda, lo que corresponde a una relación usuario-terminal de 200:1. Con una relación óptima de 30:1 podemos ofrecer 33MB de espacio en disco duro.

Los restantes 20 GB se "dividen" mentalmente en espacio para respaldo duplicado, es decir: todos los directorios personales de una celda se respaldan en dos otras celdas. Si dos celdas se dañan, todavía se pueden recuperar todos los directorios de usuarios perdidos de dos otras celdas en la red. Eso es una función "failover" mejor que la tenemos disponible en el centro de operación de redes en la UNI actualmente.4

Operación desconectada - respaldo

En vista de una desconexión de un nodo de la red, se puede forzar al sistema Coda el almacenamiento de los archivos guardados en él, un proceso llamado "hoarding". Con este se crean copias de todos los archivos respectivos en un cliente, después de esta operación se puede desconectar el servidor y seguir trabajando en las máquinas clientes.

Al reconectar el servidor, el sistema Coda se ocupa de la actualización de los cambios desde los clientes hacia el servidor.

Esta operación es útil cuando se programa mantenimiento preventivo de una computadora nodo, cuando se tiene que sustituir o reinstalar una computadora nodo, o para realización de respaldos remotos.

En todos estos casos el uso de las demás computadoras es ininterrumpido.


Georg Lehner - homepage

Instalación de las celdasTopAdministración de UsuariosAlmacenamiento distribuido de Archivos