Por qué 800G se ha convertido en una tendencia inevitable
En los centros de datos de IA modernos, un gran número de GPU deben colaborar en paralelo. Durante el entrenamiento y la inferencia de modelos, se genera un enorme tráfico este-oeste. A medida que el número de GPU sigue aumentando, si la red no consigue aumentar el ancho de banda y la eficiencia en la misma medida, la latencia de la comunicación supondrá un obstáculo directo para el pleno rendimiento informático general.
En comparación con las soluciones de 100G, 200G o incluso 400G, los transceptores ópticos de 800G representan un salto cualitativo en el ancho de banda por puerto y la eficiencia de la red. Pueden transportar volúmenes de datos significativamente mayores dentro del mismo espacio físico y densidad de puertos, lo que convierte a 800G en la opción práctica y realista para los clústeres de IA a gran escala actuales.

La evolución tecnológica de los módulos ópticos 800G
La función principal de un módulo óptico es convertir señales eléctricas en señales ópticas y viceversa. A medida que la integración de los dispositivos sigue mejorando y las velocidades de transmisión aumentan, los módulos ópticos evolucionan hacia velocidades de datos más altas, factores de forma más pequeños y un menor consumo de energía.
En la era de los 800G, dos factores de forma dominan el mercado: QSFP-DD y OSFP. QSFP-DD ofrece una gran compatibilidad con versiones anteriores y comparte un ecosistema maduro con 400G QSFP-DD, lo que permite una ruta de actualización más fluida y rentable para los centros de datos. OSFP, por otro lado, ofrece ventajas en cuanto a gestión de la potencia y rendimiento térmico, lo que lo hace más adecuado para entornos informáticos de alta potencia y alta densidad.
La coexistencia de estos dos factores de forma ofrece a los centros de datos una mayor flexibilidad en el diseño de arquitecturas de red para satisfacer diferentes requisitos de rendimiento, potencia y escalabilidad.
En la era de los módulos ópticos de 800G, la tecnología LPO (Linear-drive Pluggable Optics) ha comenzado a cobrar gran relevancia. En comparación con las soluciones tradicionales basadas en DSP, la LPO elimina las complejas etapas de procesamiento de señales, lo que se traduce en un consumo de energía sustancialmente menor y una latencia reducida. Esto hace que la LPO sea especialmente adecuada para interconexiones de corto alcance, gran ancho de banda y baja latencia en centros de datos de IA.
A medida que los proveedores de servicios en la nube continúan ampliando su infraestructura y los clústeres de IA crecen en tamaño, se espera que las soluciones LPO de 800G se adopten de forma acelerada en casos de uso específicos.

Evolución del envolvente de los módulos ópticos de 800G
A medida que las velocidades de transmisión siguen aumentando, los factores de forma de los módulos ópticos han evolucionado en consecuencia. Desde los primeros módulos GBIC y SFP, pasando por los QSFP-DD en la era de los 400G, hasta los actuales QSFP-DD y OSFP para 800G, la evolución del envolvente se ha centrado constantemente en tres objetivos fundamentales: mayor ancho de banda, mayor densidad de puertos y mejora de la eficiencia energética y térmica.
En la era de los 800G, QSFP-DD y OSFP coexisten como los dos factores de forma dominantes, lo que proporciona flexibilidad para diferentes arquitecturas de red y requisitos de implementación.

transceptor ascent optics QDD 800M8851HCM

QSFP-DD: la opción más habitual para actualizaciones fluidas
QSFP-DD (Quad Small Form-factor Pluggable Double Density) es actualmente el factor de forma más ampliamente adoptado para los módulos ópticos de 800G. Al mantener el mismo espacio físico que los módulos QSFP tradicionales y duplicar la densidad de la interfaz eléctrica, QSFP-DD permite a los centros de datos actualizar el ancho de banda sin necesidad de rediseñar los paneles frontales de los conmutadores ni la disposición de los puertos.

Las principales ventajas de QSFP-DD son:
1. Fuerte compatibilidad con versiones anteriores, compatible con QSFP+/QSFP28/QSFP56
2. Un ecosistema maduro, ideal para una migración fluida de 400G a 800G
3. Un equilibrio bien equilibrado entre la densidad de los puertos, el consumo de energía y el rendimiento térmico.
4. Como resultado, QSFP-DD suele ser la opción preferida para las redes de centros de datos basadas en Ethernet y telecomunicaciones.

OSFP: diseñado para alta potencia y velocidades futuras
OSFP (Octal Small Form-factor Pluggable) es ligeramente más grande que QSFP-DD, pero ofrece una mayor potencia y margen térmico. Esto hace que OSFP sea muy adecuado para clústeres de GPU de alta densidad y entornos HPC, al tiempo que proporciona una vía clara hacia 1,6T y más allá.

En la práctica:
QSFP-DD da prioridad a la compatibilidad y la flexibilidad de implementación
OSFP da prioridad a la potencia, la refrigeración y la escalabilidad a largo plazo
En lugar de sustituirse entre sí, se espera que los dos formatos coexistan en un futuro previsible, sirviendo para diferentes casos de uso.


Escenarios de aplicación de los módulos ópticos 800G
Centros de datos de IA e interconexiones de clústeres de GPU
Los módulos ópticos 800G proporcionan la conectividad interna de alto ancho de banda y baja latencia necesaria para el entrenamiento y la inferencia de IA a gran escala. Permiten una rápida sincronización de datos entre los nodos de la GPU, reducen los cuellos de botella en la comunicación y admiten arquitecturas de escalabilidad horizontal eficientes para los clústeres de IA modernos.
Actualizaciones de la red del centro de datos en la nube
En entornos de nube a hiperescala, los módulos ópticos 800G facilitan la evolución de las arquitecturas de red Spine-Leaf al duplicar el ancho de banda de los puertos y aumentar la densidad de los mismos. Esto ayuda a reducir los niveles de red, simplificar el cableado y mejorar la utilización del espacio y la eficiencia energética dentro de los centros de datos.
Interconexión de centros de datos (DCI)
Mediante soluciones como FR4, LR4 y ZR, los módulos ópticos de 800G admiten interconexiones de gran ancho de banda desde distancias a escala de campus hasta distancias a escala metropolitana. Permiten enlaces fiables y de gran capacidad entre centros de datos distribuidos, lo que favorece la movilidad de la carga de trabajo y la replicación de datos.
Computación de alto rendimiento (HPC) e IA generativa
Las plataformas HPC y de IA generativa a gran escala exigen un ancho de banda extremo para gestionar el intercambio intensivo de datos y el entrenamiento de modelos. Los módulos ópticos 800G son muy adecuados para implementaciones en racks de alta densidad, ya que ayudan a los sistemas a absorber los picos de tráfico, maximizar la utilización de la computación y mantener un rendimiento estable bajo cargas de trabajo máximas.

El impacto de la IA en la implementación de módulos ópticos de 800G
¿Por qué es más importante el 800G que el 400G para los servidores de IA?
En primer lugar, los servidores de IA exigen altas velocidades de transmisión de datos y baja latencia, lo que requiere conmutadores top-of-rack (ToR) con un ancho de banda subyacente adecuado. Es posible que estos conmutadores también deban tener en cuenta la sobrecarga de latencia, lo que requiere módulos ópticos de alta velocidad.
Por ejemplo, el servidor NVIDIA DGX H100 está equipado con 8 módulos GPU H100, donde cada GPU requiere 2 módulos ópticos de 200G. Por lo tanto, cada servidor necesita al menos 16 módulos de 200G, y el conmutador ToR correspondiente debe proporcionar al menos 4 puertos de 800G para soportar esta conectividad de manera eficiente.
En segundo lugar, los chips ópticos de 800G ofrecen una mayor rentabilidad y ventajas económicas. Utilizan chips EML (láser modulado por electroabsorción) de 100G, mientras que las soluciones de 200G/400G se basan en chips ópticos de 50G. Los datos muestran que, a la misma velocidad agregada, el coste de un chip óptico de 100G es aproximadamente un 30 % inferior al de dos chips ópticos de 50G. Esta ventaja en cuanto al coste cobra especial relevancia en las implementaciones de clústeres de IA a gran escala, donde el número de módulos aumenta drásticamente, lo que convierte a los 800G en una opción más económica para las infraestructuras de alto ancho de banda impulsadas por la IA.
A pesar de ello, los módulos ópticos de 400G siguen teniendo una importancia significativa en el sector. Aunque no igualan la velocidad de los módulos ópticos de 800G, representan una mejora sustancial del ancho de banda con respecto a las tecnologías anteriores y siguen siendo la solución preferida por muchas empresas. Además, ciertas aplicaciones no requieren todas las capacidades de Ethernet 800G, por lo que Ethernet 400G resulta más práctica y rentable para ellas.
A medida que sigue aumentando la demanda de una transmisión de datos más rápida y eficiente, ha llegado la era de los módulos ópticos de 800G. Con sus excepcionales capacidades de ancho de banda y los continuos avances en la tecnología LPO, los módulos ópticos de 800G están llamados a transformar la industria de la IA y los centros de datos modernos, permitiendo la próxima generación de computación de alto rendimiento y cargas de trabajo de IA a gran escala.

Fuente: Ascent Optics