Responder a la compleja cuestión de configuración, como determinar la mejor configuración RAID para los sistemas de almacenamiento conectado en red (NAS) de 4 bahías, que son ampliamente utilizados, ha sido uno de los últimos proyectos.

Laboratorio de Innovación HDD de Toshiba en Düsseldorf
Elegir el RAID adecuado
Grandes empresas y pymes de sectores económicos diversos utilizan sistemas NAS para almacenar datos en la red y proporcionar fácil acceso a los archivos. Estos sistemas contienen múltiples HDD, a menudo dispuestos en una configuración RAID (Redundant Array of Independent Disks). En función de la configuración seleccionada, la tecnología RAID puede mejorar la redundancia de los datos con características como paridad o duplicación (mirroring), ofreciendo mayor resiliencia y potencialmente un rendimiento mejorado.
Las configuraciones para sistemas NAS de 1 o 2 bahías son relativamente sencillas: una sola unidad en un sistema de una bahía sin redundancia de disco o dos unidades en un sistema de dos bahías con duplicación de datos (RAID1). Sin embargo, los sistemas NAS de 4 bahías, que son populares, presentan varias opciones de configuración. La elección de la configuración, o lo que se considera la mejor configuración RAID para un sistema NAS de 4 bahías, está fuertemente influenciada por el caso de uso individual. Para abordarlo, el Laboratorio de Innovación HDD realizó una evaluación rigurosa.

Configuración del NAS AS5404T de Asustor en el Laboratorio de Innovación HDD de Toshiba
El partner de Toshiba, Asustor, proporcionó una unidad de su sistema NAS AS5404T, un modelo de 4 bahías con conectividad de red de 2,5GbE. Admite hasta 4 unidades SSD M.2 para almacenamiento en caché. Sin embargo, dado que el objetivo del proyecto de evaluación era medir el rendimiento base del conjunto de HDD en aplicaciones con un flujo de datos continuo, la opción de caché fue descartada. No obstante, debe señalarse que el almacenamiento en caché SSD mejora el rendimiento aleatorio en ráfagas cortas de datos entrantes o lecturas repetidas desde la misma localización. Pero, en última instancia, el rendimiento sostenido depende de la velocidad del HDD y de la configuración RAID elegida.
Se instalaron dos SSD M.2 NVMe de 256GB para crear el Pool1 con RAID1. Este Pool1 se utilizó para el sistema operativo, mientras que el Pool2 de HDD, instalado posteriormente, se reservó para los datos de usuario. Esta configuración garantiza que las interacciones del disco del sistema operativo no interfieran con la carga de trabajo de almacenamiento.
Para la prueba, el laboratorio equipó el sistema NAS de 4 bahías (AS5404T) con cuatro HDD Toshiba N300 de 8TB. El laboratorio evaluó las tres configuraciones más comunes de 4 discos: RAID5, RAID6 y RAID10.
Para cada configuración RAID, el laboratorio configuró un pool de almacenamiento HDD en el NAS, esperó la inicialización completa y creó un objetivo de almacenamiento en bloque iSCSI con aprovisionamiento grueso (thick-provisioned), usando el 80% del tamaño del pool utilizable. Se conectó un objetivo iSCSI a través de la interfaz de red 2.5GbE a un servidor de aplicaciones y se creó una unidad lógica de Windows que se nutrió con 2TB de datos para pruebas. En una segunda ronda del benchmarking, se crearon dos objetivos iSCSI en el pool de HDD y se conectaron al servidor de aplicaciones mediante conexiones 2.5GbE separadas, usando todo el ancho de banda de red del AS5404T, que cuenta con dos puertos 2.5GbE.
Se evaluaron tres tipos de carga de trabajo: escritura y lectura secuenciales en bloques de 1MB y tareas mixtas de lectura/escritura aleatoria.
Configuraciones RAID probadas
Dependiendo de los requisitos específicos del sistema NAS, se pueden implementar tres técnicas en diversas configuraciones RAID. Como su nombre indica, la “duplicación” (mirroring) implica copiar los datos en múltiples discos, asegurando la redundancia. El “distribuido” (striping), por otro lado, es una técnica que divide los datos en varios discos para mejorar el rendimiento. La “paridad” es una forma calculada de verificación de errores que proporciona redundancia de datos. En caso de fallo de una unidad, el sistema NAS reconstruye los datos perdidos o dañados.
RAID5
En RAID5, los datos se distribuyen en tres discos y el cuarto disco contiene la información de paridad, lo que permite la reconstrucción de los datos si una unidad falla. Esta configuración ofrece una eficiencia de almacenamiento del 75%, proporcionando 24TB de espacio utilizable con las cuatro unidades de 8TB. Si bien las velocidades de lectura son rápidas, las velocidades de escritura pueden verse reducidas porque la paridad debe calcularse y escribirse. Durante una reconstrucción, toda la paridad debe recalcularse, un proceso que consume muchos recursos.
RAID6
RAID6, utilizado tradicionalmente para conjuntos RAID de seis discos o más, almacena dos franjas de paridad, lo que permite al sistema NAS tolerar el fallo de dos unidades. Esto es útil cuando una segunda unidad falla durante la reconstrucción de una unidad previamente dañada. Cuando se utiliza con solo cuatro discos, la eficiencia de almacenamiento cae al 50%, resultando en una capacidad total utilizable de 16TB. La mayor tolerancia a fallas aleatorias de unidades puede justificar esta elección incluso para sistemas con solo cuatro discos.
RAID10
Una configuración RAID10 logra redundancia duplicando los datos entre pares de discos y luego distribuyendo esas duplicaciones. Esto evita los cálculos de paridad que consumen recursos, pero el compromiso es una menor eficiencia de almacenamiento, resultando en una capacidad utilizable de 16TB. RAID10 también tolera el fallo de dos discos, pero solo si no pertenecen al mismo par duplicado.
Identificar la mejor configuración
Las pruebas del laboratorio revelaron que la “mejor” configuración depende del objetivo principal del usuario: capacidad, protección o rendimiento.
En las pruebas utilizando una sola conexión 2.5GbE, el rendimiento secuencial de RAID5 y RAID10 estuvo limitado por el ancho de banda de red (~290 MB/s). RAID6 mostró un rendimiento de escritura secuencial ligeramente inferior debido a los cálculos de doble paridad. En cargas de trabajo mixtas aleatorias, RAID10 tuvo el mejor desempeño, seguido por RAID5 y RAID6.

Las recomendaciones son:
- Para máxima capacidad, usar RAID5, que ofrece un 75% de eficiencia de almacenamiento con protección y velocidad razonables.
- Para máxima protección de datos, usar RAID6; sin embargo, esto implica pérdida de velocidad y capacidad debido a su tolerancia a dos fallos simultáneos de unidad.
- Para máximo rendimiento en cargas de trabajo mixtas, usar RAID10, aunque requiere un compromiso en capacidad y protección.
La evaluación exploró, además, los límites de rendimiento del sistema NAS de 4 bahías usando ambas conexiones 2.5GbE, superando las limitaciones de ancho de banda de red.

Los resultados para RAID5, RAID6 y RAID10 siguieron las mismas tendencias: RAID5 para capacidad, RAID6 para protección y RAID10 para cargas mixtas. Sin embargo, el laboratorio identificó una configuración avanzada que proporcionó el rendimiento secuencial óptimo.
Desbloqueando el rendimiento máximo
Los HDD funcionan mejor en operaciones secuenciales; tener dos bloques iSCSI en un mismo pool de HDD causa búsquedas frecuentes cuando se accede a ambos bloques de forma simultánea. Usar dos pools RAID1 separados lo evita. Esta configuración, compatible con el AS5404T, evita búsquedas frecuentes. El laboratorio creó un bloque iSCSI por pool y los conectó mediante interfaces 2.5GbE separadas.

Usando la configuración 2xRAID1 con conexiones duales 2.5GbE, el sistema NAS alcanzó velocidades de escritura secuencial de 522MB/s y de lectura secuencial de 572MB/s. Este rendimiento supera al RAID10 y alcanza el ancho de banda teórico de 2.5GbE. Si la red y la aplicación admiten múltiples entidades lógicas de almacenamiento, esta configuración ofrece el rendimiento óptimo manteniendo una protección y eficiencia de capacidad similares a RAID10.
Energía y refrigeración
En modo de suspensión, sin acceso al almacenamiento ni a la interfaz GUI del NAS, el consumo de energía es básicamente el de la unidad de procesamiento del NAS, 20W. Durante la operación completa de datos, el consumo de energía varía entre 50W y 60W. Ambos valores son excelentes, favoreciendo la eficiencia energética y la sostenibilidad.
El sistema de refrigeración del AS5404T mantiene las temperaturas internas de los HDD por debajo de 50°C, incluso bajo carga. Aunque la fiabilidad a largo plazo de los HDD puede degradarse por encima de los 45°C, los periodos más largos en reposo o suspensión, con temperaturas más bajas, ayudan a mitigar este efecto. No obstante, para operación continua a plena carga, la temperatura ambiente (externa) no debe exceder los 23°C para garantizar que los HDD se mantengan lo suficientemente fríos para una fiabilidad máxima y una probabilidad mínima de fallo.
Conclusión
El sistema NAS de 4 bahías AS5404T de Asustor, equipado con cuatro HDD Toshiba N300, ofrece alta capacidad, sólido rendimiento y protección efectiva contra fallos de las unidades de disco.
Con un solo puerto 2.5GbE, las configuraciones RAID5/6/10 saturan la red (~250 MB/s). Con ambos puertos, el rendimiento alcanza entre 350 MB/s y 400 MB/s. Usar dos pools RAID1 logra más de 500 MB/s, que es el límite teórico de doble 2.5GbE.
El consumo de energía de la unidad es relativamente bajo (20W en modo de suspensión, ~50 W en modo activo) y la refrigeración es eficaz, manteniendo las temperaturas de los HDD dentro de los límites recomendados para una fiabilidad a largo plazo.
El Laboratorio de Innovación HDD de Toshiba está disponible para apoyar a los socios comerciales interesados en realizar sus propias pruebas o evaluar configuraciones.
Autor: Rainer W. Kaese, director senior de Desarrollo de negocio de HDD de Toshiba Electronics Europe GmbH
