¿Qué es RAID?

¿Qué es RAID?

El término RAID es un acrónimo del inglés “Redundant Array of Independent Disks”. Significa matriz redundante de discos independientes. RAID es un método de combinación de varios discos duros para formar una única unidad lógica en la que se almacenan los datos de forma redundante. Ofrece mayor tolerancia a fallos y más altos niveles de rendimiento que un sólo disco duro o un grupo de discos duros independientes.

Una matriz consta de dos o más discos duros que ante el sistema principal funcionan como un único dispositivo. Un RAID, para el sistema operativo, aparenta ser un sólo disco duro lógico (LUN). Los datos se desglosan en fragmentos que se escriben en varias unidades de forma simultánea. En este método, la información se reparte entre varios discos, usando técnicas como el entrelazado de bloques (RAID nivel 0) o la duplicación de discos (RAID nivel 1) para proporcionar redundancia, reducir el tiempo de acceso, y/o obtener mayor ancho de banda para leer y/o escribir, así como la posibilidad de recuperar un sistema tras la avería de uno de los discos.

La tecnología RAID protege los datos contra el fallo de una unidad de disco duro. Si se produce un fallo, RAID mantiene el servidor activo y en funcionamiento hasta que se sustituya la unidad defectuosa.

La tecnología RAID se utiliza también con mucha frecuencia para mejorar el rendimiento de servidores y estaciones de trabajo. Estos dos objetivos, protección de datos y mejora del rendimiento, no se excluyen entre sí.

RAID ofrece varias opciones, llamadas niveles RAID, cada una de las cuales proporciona un equilibrio distinto entre tolerancia a fallos, rendimiento y coste.

Todos los sistemas RAID suponen la pérdida de parte de la capacidad de almacenamiento de los discos, para conseguir la redundancia o almacenar los datos de paridad.

Los sistemas RAID profesionales deben incluir los elementos críticos por duplicado: fuentes de alimentación y ventiladores redundantes y Hot Swap. De poco sirve disponer de un sistema tolerante al fallo de un disco si después falla por ejemplo una fuente de alimentación que provoca la caída del sistema.

También cada vez es más recomendable, sobre todo en instalaciones de cluster, configuraciones de dos controladoras redundantes y Hot Swap, de manera que en el caso de fallo de una de ellas se puede proceder a su sustitución sin tener que detener el funcionamiento del sistema. Además, esta configuración con controladoras redundantes nos permite conectar el sistema RAID a diferentes servidores simultáneamente.

Ventajas de RAID
RAID proporciona tolerancia a fallos, mejora el rendimiento del sistema y aumenta la productividad.

Tolerancia a fallos: RAID protege contra la pérdida de datos y proporciona recuperación de datos en tiempo real con acceso interrumpido en caso de que falle un disco.

Mejora del Rendimiento/ Velocidad: Una matriz consta de dos o más discos duros que ante el sistema principal funcionan como un único dispositivo. Los datos se desglosan en fragmentos que se escriben en varias unidades de forma simultánea. Este proceso, denominado fraccionamiento de datos, incrementa notablemente la capacidad de almacenamiento y ofrece mejoras significativas de rendimiento. RAID permite a varias unidades trabajar en paralelo, lo que aumenta el rendimiento del sistema.

Mayor Fiabilidad: Las soluciones RAID emplean dos técnicas para aumentar la fiabilidad: la redundancia de datos y la información de paridad. La redundancia implica el almacenamiento de los mismos datos en más de una unidad. De esta forma, si falla una unidad, todos los datos quedan disponibles en la otra unidad, de inmediato. Aunque este planteamiento es muy eficaz, también es muy costoso, ya que exige el uso de conjuntos de unidades duplicados. El segundo planteamiento para la protección de los datos consiste en el uso de la paridad de datos. La paridad utiliza un algoritmo matemático para describir los datos de una unidad. Cuando se produce un fallo en una unidad se leen los datos correctos que quedan y se comparan con los datos de paridad almacenados por la matriz. El uso de la paridad para obtener fiabilidad de los datos es menos costoso que la redundancia, ya que no requiere el uso de un conjunto redundante de unidades de disco.

Alta Disponibilidad: RAID aumenta el tiempo de funcionamiento y la disponibilidad de la red. Para evitar los tiempos de inactividad, debe ser posible acceder a los datos en cualquier momento. La disponibilidad de los datos se divide en dos aspectos: la integridad de los datos y tolerancia a fallos. La integridad de los datos se refiere a la capacidad para obtener los datos adecuados en cualquier momento. La mayoría de las soluciones RAID ofrecen reparación dinámica de sectores, que repara sobre la marcha los sectores defectuosos debidos a errores de software. La tolerancia a fallos, el segundo aspecto de la disponibilidad, es la capacidad para mantener los datos disponibles en caso de que se produzcan uno o varios fallos en el sistema.

Tipos de RAID
Existen dos tipos de tecnología RAID: basada en software y basada en hardware. Cada uno de ellos tiene sus ventajas y sus inconvenientes.

A su vez, el RAID basado en hardware puede ser basado en host o RAID externo.

La ventaja de los RAID basados en hardware es su independencia de la plataforma o sistema operativo, ya que son vistos por éste como un gran disco duro más, y además son mucho más rápidos, entre otras ventajas. Los sistemas RAID software no son implementaciones adecuadas en la mayoría de los casos, y cada vez son menos empleados.

El software RAID puede ser una opción apropiada cuando el factor de decisión es el coste inicial. Sin embargo, cuando se considera el coste total de propiedad, los costes ocultos del software RAID pueden convertirlo en la opción más cara a largo plazo. Este coste más elevado de propiedad del RAID basado en software, es debido a la productividad más baja del usuario, costes más altos de gestión y reconfiguración. Sistemas operativos de redes como NetWare y Windows NT incluyen software RAID integrado. Todas las funciones RAID son manejadas por la CPU, lo que puede ralentizar en exceso otras aplicaciones. Este tipo de RAID no ofrece protección para el sistema operativo, a menos que se añada una unidad adicional a la matriz. Además, el RAID basado en software no cuenta con importantes características, como el intercambio de unidades de repuesto en funcionamiento, matrices de arranque y funciones de gestión remota. La utilización excesiva de la CPU es su principal inconveniente. Las soluciones RAID dependen del software para controlar la matriz. Sin embargo, las matrices basadas en software ejecutan todos los comandos de E/S y los algoritmos con numerosas operaciones matemáticas en la CPU del host. Esto puede ralentizar el rendimiento del sistema, ya que aumenta el tráfico del bus PCI del host y la utilización e interrupciones de la CPU. El uso del software RAID puede degradar el rendimiento del sistema hasta un nivel en el que resulta más costoso actualizar.

A diferencia de las matrices basadas en software, las que están basadas en hardware utilizan controladores RAID que se conectan a una ranura PCI del host. Con tan sólo una diferencia mínima de precio con respecto al coste del controlador que se necesita para el software RAID, el hardware RAID ofrece ventajas significativas en lo que respecta a:
* Rendimiento
* Integridad de los datos
* Gestión de matrices

El hardware RAID basado en host supone un mayor rendimiento que el RAID basado en software, sin embargo la solución más profesional y de gama alta es la solución hardware RAID externa. En este caso, las operaciones RAID se llevan a cabo mediante un controlador situado en el subsistema de almacenamiento RAID externo, que se conecta al servidor mediante un adaptador de bus de host SCSI o Fibre Channel. Las soluciones RAID externas son independientes del sistema operativo, aportan mayor flexibilidad y permiten crear sistemas de almacenamiento de gran capacidad para servidores de gama alta.

Oficialmente los sistemas RAID se implementan en 7 configuraciones o niveles: RAID 0 a RAID 6. También existen combinaciones de niveles de RAID, las combinaciones más comunes son RAID 10 y RAID 0+1. Los sistemas RAID son comúnmente implementados con discos de la misma capacidad para todo el conjunto.

A nivel práctico y comercial, sólo los RAID impares, junto a las combinaciones de estos, se han impuesto en el mercado: RAID 1, 3, 5, 7, 1+0, y 0+1. Destacan por su aceptación sobre los demás el RAID 1, 5, 10, y 0+1.

Historia
El sistema RAID fue propuesto por primera vez en 1988 por David A. Patterson, Garth A. Gibson y Randy H. Katz en la publicación “Un Caso para Conjuntos de Discos Redundantes Económicos (RAID)”. Este fue publicado en la Conferencia SIGMOD de 1988.

Niveles de RAID
RAID 0: Conjunto de discos divididos sin tolerancia a fallos (No Redundante)

El RAID de nivel 0 no tiene mínimo de discos para ser empleado. Se puede crear un Raid 0 con un solo disco, pero la ganancia en velocidad es inapreciable. Si conectas 2 discos duros diferentes, por ejemplo, de 100GB y 120GB respectivamente, obtienes una capacidad de 200GB (es decir, dos veces el tamaño del disco más pequeño), “perdiendo” 20GB por la diferencia de capacidades de disco. Por eso se recomienda usar 2 discos con las mismas características. <— con algunas controladoras al hacer RAID 0 por hardware se obtiene la suma de todos los discos que se metan en RAID, en el ejemplo se obtendrían 220 GB y no se perdería espacio alguno.

Características y Ventajas
El RAID 0 implementa un conjunto de discos divididos, la información es separada en bloques y cada bloque es grabado en una unidad de disco diferente. El rendimiento de Entrada/Salida se ve muy beneficiado por la dispersión de la carga de Entrada/Salida a través de muchos canales y discos.

El mejor rendimiento se alcanza cuando los datos son divididos a través de múltiples controladoras con tan solo un disco por controladora. No existe sobrecarga por el cálculo de paridad. Un diseño muy simple. Fácil de implementar.

Desventajas
No es realmente un RAID ya que no es tolerante a fallos. El fallo de una sola unidad produciría una pérdida de información en el conjunto. No se debe utilizar en sistemas de misión crítica que impliquen modificación de datos. (Algunas aplicaciones trabajan con información de control almacenada en un sistema de archivos en RAID1 ó 5 y los datos multimedia en RAID 0, los cuales son respaldados a cinta o a medios ópticos.)

Aplicaciones Recomendadas
Edición y producción de Vídeo
Edición de imágenes
Aplicaciones de Preimprenta
Cualquier aplicación que requiera gran ancho de banda.
RAID 1: Mirroring y Duplexing (Espejo)

Para el mejor rendimiento, la controladora debe ser capaz de realizar dos lecturas concurrentes separadas por cada par duplicado, y dos escrituras duplicadas por cada par duplicado.

El nivel de RAID 1 requiere al menos dos unidades de disco para ser implementado

Características
Son posibles una escritura o dos lecturas por par. El doble de la tasa de transacciones de lectura de un disco simple, la misma tasa de escritura que un disco simple.

Redundancia del 100% en los datos significa que no es necesaria la reconstrucción en el caso de fallo de un disco, solo una copia para el reemplazo de disco.

La tasa de transferencia por bloque es igual a la de un disco simple. Bajo ciertas circunstancias, el RAID 1 puede sostener fallas en múltiples hunch.

Es el diseño de un subsistema de almacenamiento en RAID más sencillo.

Ventajas
– Debido a que un disco es espejeado en par y contiene toda la información, puede ser potencialmente utilizado sin software o hardware para RAID

Desventajas
– El más alto volumen de carga de todos los tipos de RAID, (100%) ineficiente.

Aplicaciones Recomendadas
Contabilidad
Nómina
Finanzas
Cualquier aplicación que requiera de alta disponibilidad
Servidores

RAID 2: Código de Corrección de Error
El esquema de redundancia en el RAID de nivel 2 es un código de Hamming, donde la unidad de separación es un bit simple. Dividir al nivel de bit tiene la implicación de que en un conjunto de discos con N discos de datos, la unidad más pequeña de datos de transferencia para una lectura es un conjunto de N bloques.

El RAID de nivel 2 funciona a bajo nivel y su implementación no es usada actualmente.

RAID 3: Paridad de intervalo de bit (Paridad de Richard M. Price)

El RAID de nivel 3 tiene un disco de comprobación y solamente procesa una E/S a la vez.

El RAID de nivel 3 es implementado en contadas ocasiones. Por su función a bajo nivel.

RAID 4: Unidad de paridad dedicada (Paridad de intervalo de bloque)

Características
Los discos son divididos, como en RAID 0. La paridad de información para la división es calculada, y almacenada en un disco de paridad. Si uno de los discos falla, la información es reconstruida en un disco de repuesto utilizando la información de paridad. Si el disco de paridad falla, la paridad de la información es recalculada en un disco de repuesto. La ventaja con el RAID 3 está en que se puede acceder a los discos de forma individual.

Desventajas
El disco de paridad puede ser un “cuello de botella”(bottleneck) durante las operaciones de escritura

RAID 5: Discos de datos independientes con bloques de paridad distribuidos (Bloques de Intervalo de Paridad Distribuida)

Cada vez que un bloque de datos (algunas veces llamado pedazo) es escrito en un disco dentro de un conjunto, un bloque de paridad es generado dentro de la misma división. (Un bloque o pedazo esta compuesto de muchos sectores consecutivos en un disco, algunas veces tanto como 256 sectores. Una serie de pedazos [un pedazo de cada disco dentro de un conjunto] es llamada colectivamente una división.) Si otro bloque, o alguna porción del bloque es escrita en la misma división, el bloque de paridad (o una parte del bloque de paridad) es recalculada y vuelta a escribir. El disco utilizado por el bloque de paridad es escalonado desde una división hasta la siguiente, de ahí el término bloques de paridad distribuidos.

Es interesante que los bloques de paridad no sean leídos en las lecturas de datos, ya que esto sería una sobrecarga innecesaria y podría disminuir el rendimiento. Los bloques de paridad son leídos, sin embargo, cuando la lectura de un sector de datos resulta en un error CRC. En este caso, el sector en la misma posición relativa en cada uno de los bloques de datos restantes en la división y dentro del bloque de paridad en la división son utilizados para reconstruir el sector erróneo. El error CRC se encuentra oculto para la computadora. De cualquier manera, si un disco falla en el conjunto, los bloques de paridad en los discos sobrevivientes son combinados matemáticamente con los bloques de datos de los discos sobrevivientes para reconstruir los datos de la unidad que ha fallado al vuelo. Esto es algunas veces llamado Modo Interno de Recuperación de Datos. La computadora no se entera de que el disco ha fallado. La acción de leer y escribir al conjunto de discos continúa normalmente, aunque con alguna degeneración de rendimiento. En RAID 5, en los conjuntos que solo tienen un bloque de paridad por división, la falla de una segunda unidad de disco resulta en la pérdida total de la información.

El RAID de nivel 5 requiere de al menos 3 unidades de disco para ser implementado. El número máximo de discos teóricamente es ilimitado, pero en la práctica es común mantener un máximo de 14 unidades de disco o menos para implementaciones de RAID 5 que tienen un solo bloque de paridad por división. La razón de esta restricción es que existe una gran concordancia en cuanto a que una unidad de disco fallará en el conjunto cuando exista un gran número de unidades de disco. (El valor del Tiempo Estimado Entre fallas MTBF para una unidad de disco dentro de un conjunto se vuelve más pequeño.) En implementaciones con más de 14 unidades de disco, el RAID 5 con paridad dual (también conocido como RAID 6) es algunas veces utilizado ya que puede sobrevivir a la falla de dos discos.

Características y Ventajas
Mayor tasa de transacciones de lectura. De media a pobre tasa de transacciones de escritura, especialmente cuando el CPU realiza chequeos de paridad por software. Bajo coeficiente de discos ECC (Paridad) para los discos de datos significa alta eficiencia. Buena tasa de transferencia agregada.

Desventajas
El fallo de unidades de disco tiene un impacto medio en el caudal de salida. Diseño de controladoras más complejo. Dificultad para reconstruir en el caso de fallo de una unidad de disco (comparada con el RAID de nivel 1). En bloques de datos individuales la tasa de transferencia es la misma que en un disco individual. Alta sobrecarga para escrituras pequeñas. Para cambiar 1 byte en un archivo, la división completa debe ser leída, el byte modificado, la información de paridad recalculada, y la división entera vuelta a escribir. Sin embargo, el hecho de que los sistemas de archivos tienden a dirigirse a los discos naturalmente en clusters oculta parcialmente este efecto.

Aplicaciones Recomendadas
Servidores de Archivos y de Aplicaciones
Servidores de Bases de Datos
Servidores de web, e-mail y de noticias
Servidores de Intranet
Es el nivel de RAID más versátil
Se puede configurar RAID 5 con disco de respaldo lo que permite obtener dos niveles de contingencia

RAID 6: Discos de Datos Independientes con Doble Paridad
Bloques de datos enteros son grabados en el disco; la paridad es generada y escrita a las dos líneas, en dos unidades separadas.

El RAID de nivel 6 requiere un mínimo de tres unidades, pero cuatro son requeridas para exceder la eficiencia en espacio de RAID 1.

Características
El conjunto de mayor redundancia en paridad, muy ineficiente con pocos discos, pero mucho más tolerante a fallas. Las unidades pueden ser organizadas en matrices ortogonales, donde las filas de discos forman grupos de paridad, similar al RAID 5, mientras las columnas también mantienen una paridad consistente entre cada una de ellas. Si un solo disco falla, ya sea su fila o columna de paridad puede ser utilizada para reconstruirlo, Varias unidades dentro del conjunto pueden fallar antes de que este se vuelva corrupto. Cualquier grupo de discos no coincidentes puede fallar antes de que el conjunto se corrompa.

Recomendado para: aplicaciones de imágenes y fileserver en general

RAID 10: Una línea de Espejos
Se crean múltiples espejos de RAID 1, y una línea de RAID 0 es creada sobre estas. Este no es uno de los seis niveles originales, sino la combinación de RAID 1 y 0, algunas veces también llamada RAID 1+0.

Ventajas
Potencialmente puede manejar múltiples fallas de discos simultáneas, mientras uno de los discos de cada par espejeado continúe trabajando.

Las mismas ventajas y desventajas del RAID 1…

RAID 0 + 1: Un espejo de líneas
Dos líneas de RAID 0 son creadas, y un espejo en RAID 1 es creado sobre estas. Este tampoco es uno de los 6 niveles originales de RAID.

Desventajas
No es tan robusto como el RAID 1+0. No puede tolerar dos fallos simultáneos de discos, si no son de la misma línea ETC.

Anuncios

Acerca de quice85

Hola soy ingeniero en sistemas computacionales me dedico a dar clases, talleres de programación, diseño gráfico, diseño y programación de páginas WEB, mantenimiento, animación y ofimática. Mi nombre es Elfego Emilio Quintana de la Cruz (quice85). Correo: E-mail:quice85@outlook.com E-mail alternativo: quice85@hotmail.com o quice85@gmail.com. Facebook: Emilio Quintana o quice85. Twitter@: Emilio Quintana o quice85. Youtube: quice85. Empresa: SIEE (Sistemas Informáticos Eléctricos Electrónicos).
Esta entrada fue publicada en Enlaces, Sistemas. Guarda el enlace permanente.

Una respuesta a ¿Qué es RAID?

  1. susano dijo:

    Yo me decanto por un RAID 5 o RAID 10. Son los arreglos mas seguros. En cuanto a la seguridad de los datos, hay matices… Se puede, con cualquier arreglo raid, sufrir perdida de datos. Y, en consecuente, tener que recurrir a algun servicio de recuperacion especializado (Onretrieval, etc…)

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s