Größere und effizientere Modelle für maschinelles Lernen (ML) werden eine Schlüsselrolle bei der Bewältigung der wachsenden Anforderungen an KI-Beschleunigungs-Workloads spielen. Der Bedarf an einer signifikanten Skalierung zukünftiger Recheninfrastrukturen treibt das exponentielle Wachstum der E/A-Bandbreite und der Konnektivitätsreichweite voran, um größere xPU-Cluster sowie ressourceneffizientere Architekturen wie GPU-Disaggregation und Memory-Pooling zu unterstützen.
Elektrische Ein-/Ausgabe (d. h. Kupferleiterverbindungen) ermöglicht hohe Bandbreitendichte und geringen Stromverbrauch, jedoch nur sehr kurze Reichweiten von maximal einem Meter. Steckbare optische Transceiver-Module, wie sie in heutigen Rechenzentren und frühen KI-Clustern eingesetzt werden, können die Reichweite zwar erhöhen, jedoch zu Kosten und einem Stromverbrauch, die angesichts der zukünftigen Skalierungsanforderungen von KI-Workloads nicht tragbar sind.
Eine integrierte xPU (CPU, GPU, IPU) optische I/O-Lösung kann höhere Bandbreiten bei hoher Energieeffizienz, geringer Latenz und größerer Reichweite unterstützen, was genau den Anforderungen an eine skalierbare KI/ML-Infrastruktur entspricht.
Optische I/O-Lösung basierend auf Intel-Siliziumphotonik
Intel hat einen vollständig integrierten, bidirektionalen OCI-Chiplet mit 4 Tbit/s auf Basis seiner proprietären Siliziumphotonik-Technologie entwickelt, um den enormen Bandbreitenbedarf von KI-Infrastrukturen zu decken und zukünftige Skalierbarkeit zu ermöglichen. Dieser OCI-Chiplet enthält einen integrierten Siliziumphotonik-Schaltkreis (PIC) mit integrierten Lasern, einen elektrischen integrierten Schaltkreis mit HF-TSV sowie eine Schnittstelle zur Integration eines abnehmbaren/wiederverwendbaren optischen Steckverbinders.
Der OCI-Chip lässt sich mit CPUs, GPUs, IPUs der nächsten Generation und anderen bandbreitenintensiven System-on-a-Chip (SoC)-Anwendungen kombinieren. Diese erste Implementierung ebnet den Weg für optische Multiterabit-Verbindungen mit mehr als vierfach höherer Bandbreitendichte als PCIe Gen6, einer Energieeffizienz von unter 3 pJ/Bit, einer Latenz von unter 10 ns (+TOF) und einer Reichweite von über 100 Metern.
Wir planen, unseren OCI-Chiplet der ersten Generation, der zusammen mit einer Intel-Konzept-CPU eine fehlerfreie Glasfaserverbindung (BER <10E-12 mit PRBS31-Muster) ermöglicht, auf der OFC 2024 in San Diego vom 26. bis 28. März (Intel-Stand Nr. 1501) zu demonstrieren. Diese erste OCI-Implementierung ist ein bidirektionaler 4-Tbit/s-Chiplet, der mit PCIe Gen5 kompatibel ist und 64 Datenleitungen mit je 32 Gbit/s in beide Richtungen über mehrere zehn Meter unterstützt. Die Realisierung erfolgt über acht Glasfaserpaare, die jeweils acht DWDM-Wellenlängen übertragen. Über diese erste Implementierung hinaus bietet die Plattform Sichtverbindungsfähigkeit für 32-Tbit/s-Chiplets.

OCI-Sender: Optisches Spektrum von 8 Wellenlängen in einer Standard-Singlemode-Faser
Der einzige PIC im aktuellen Chip-Stack unterstützt bidirektionale Anwendungen mit bis zu 8 Tbit/s und verfügt dank Intels einzigartiger Fähigkeit, DWDM-Laserarrays und optische Verstärker direkt auf den PIC zu integrieren, über ein vollständiges optisches Subsystem. Dies bietet eine um Größenordnungen höhere Zuverlässigkeit als herkömmliche InP-Laser. Diese integrierten Siliziumphotonik-Chips werden in einem unserer US-amerikanischen Produktionswerke mit hoher Stückzahl gefertigt. Dort wurden bereits über 8 Millionen PICs mit mehr als 32 Millionen On-Chip-Lasern in steckbaren optischen Transceivern für Rechenzentrumsnetzwerke ausgeliefert, die branchenführende Zuverlässigkeit bieten. Neben den nachgewiesenen Vorteilen in Leistung und Zuverlässigkeit ermöglicht die On-Chip-Lasertechnologie die Fertigung, den Durchlauf und das Testen auf Wafer-Ebene. Dies führt zu einer höheren Einfachheit und Zuverlässigkeit auf Subsystemebene (z. B. keine Glasfaserverbindung zwischen ELS und PIC) und zu einer effizienteren Fertigung.
Ein weiterer entscheidender Vorteil von OCI besteht darin, dass es standardmäßige, weit verbreitete Singlemode-Fasern (SMF-28) verwendet. Dadurch entfällt im Gegensatz zu anderen technischen Ansätzen auf dem Markt die Notwendigkeit von polarisationserhaltenden Fasern (PMF). PMF wurden bisher selten eingesetzt, da Systemvibrationen und Faserbewegungen die Leistung und die zugehörige Link-Budgetierung negativ beeinflussen können.
Mehrere Intel-Gruppen tragen zur Entwicklung und Implementierung von OCI als Schlüsseltechnologie für optische Ein-/Ausgabe bei. Dies unterstreicht, wie Intel mit seinen führenden Kompetenzen in den Bereichen Silizium, Optik, Gehäusebau und Plattformintegration eine umfassende Computing-Lösung der nächsten Generation bereitstellen kann.
Intels bewährte Siliziumphotonik-Plattform und -Technologie können die zuverlässigsten und leistungsstärksten optischen Verbindungslösungen liefern, um allgegenwärtige KI zu ermöglichen.

