Los centros de datos consumen grandes cantidades de energía. Según Bitkom, la principal asociación industrial del sector digital de Alemania, las necesidades de electricidad para alimentar los centros de datos se han más que duplicado en la última década. Y con la transformación digital recién salida de los bloques de salida, esta tendencia está realmente acelerándose. Almacenar, procesar, transmitir y recuperar datos requiere energía. La inteligencia artificial, en particular, consume mucha energía. A nivel mundial, se están utilizando múltiples teravatios hora para entrenar y ejecutar los enormes modelos de IA actuales. (Un teravatio hora equivale a mil millones de kilovatios hora de energía eléctrica). El uso de estos modelos para generar imágenes y textos también consume grandes cantidades de energía. Como resultado, los centros de datos tienen que ser cada vez más grandes, lo que significa que necesitan cada vez más electricidad para alimentar y enfriar la enorme cantidad de procesadores involucrados, lo que a su vez está provocando un aumento masivo de su huella de carbono. Nada de esto está ayudando a Europa a alcanzar su objetivo de emisiones netas de gases de efecto invernadero cero para 2050. Es evidente que algo tiene que cambiar.
«La IA puede ser mucho más eficiente desde el punto de vista energético. Con el enfoque adecuado, podemos hacer que los centros de datos del futuro sean mucho más sostenibles», afirma el profesor Wolfgang Maaß, que investiga en la Universidad de Sarre y en el Centro Alemán de Investigación en Inteligencia Artificial (DFKI). En un esfuerzo por frenar el apetito energético de la IA y conservar los recursos, su equipo de investigación está desarrollando modelos de IA más ligeros y personalizados. También quieren identificar formas de que los centros de datos sean más inteligentes desde el punto de vista energético.
«Al hacer que los modelos sean más pequeños y eficientes, estamos ayudando a impulsar la sostenibilidad», afirma la Dra. Sabine Janzen, investigadora científica sénior del equipo de Wolfgang Maaß. «Nuestro trabajo también está abriendo el acceso a potentes modelos de IA para pequeñas y medianas empresas, porque estos modelos de IA más pequeños y ligeros no necesitan una gran infraestructura técnica. Esto permitirá que todo el mundo, no solo los grandes actores, aprovechen esta nueva tecnología», afirma Janzen.
Los chatbots de IA actuales, como ChatGPT, y los modelos de IA visual utilizan billones de parámetros y vastos conjuntos de datos para realizar sus tareas. La cantidad de energía que consumen es, en consecuencia, enorme. Los investigadores de Saarbrücken están desarrollando formas de reducir este consumo de energía, sin comprometer la calidad de los resultados de estos modelos de IA más ligeros. «Un elemento central de nuestro trabajo es una técnica conocida como destilación de conocimiento. Es un tipo de técnica de compresión que nos permite crear modelos más pequeños y, por tanto, más eficientes desde el punto de vista energético, pero que funcionan igual de bien que los modelos más grandes», explica Sabine Janzen.
El enfoque utilizado por el equipo de investigación podría describirse de la siguiente manera: cuando se busca la respuesta a una pregunta específica, no se lee toda una biblioteca; en su lugar, uno se centra solo en aquellos libros que son relevantes para su pregunta. Los investigadores de Saarbrücken extraen modelos «estudiantiles» más pequeños, más enfocados y más eficientes energéticamente a partir de modelos «maestros» más grandes. Al destilar el conocimiento necesario para realizar tareas en un área específica y reducirlo a lo esencial, pueden reducir el tamaño de los modelos de datos hasta en un noventa por ciento. Los parámetros del modelo que no son relevantes para el área de interés no se tocan. «En términos de velocidad de inferencia, es decir, la rapidez con la que el modelo puede procesar los datos de entrada y producir resultados, estos modelos de estudiantes funcionan a un nivel comparable al de los modelos de profesores más grandes, pero requieren un 90 % menos de energía para hacerlo», explica Janzen.
Mediante el uso de otra técnica de eficiencia automatizada conocida como «búsqueda de arquitectura neuronal» (NAS), el equipo también ha logrado algunos resultados impresionantes con modelos de IA visual, es decir, modelos que procesan datos de imágenes digitales. «Nuestros resultados más recientes muestran que podemos utilizar el método NAS para reducir el tamaño de los modelos en aproximadamente un noventa por ciento», afirma Sabine Janzen. En este trabajo, los investigadores se centran en el aprendizaje automático con redes neuronales artificiales, un método de IA que consume mucha energía y puede analizar grandes volúmenes de datos. Las redes neuronales artificiales están diseñadas para imitar el cerebro humano. Nuestros cerebros contienen muchos miles de millones de células nerviosas, llamadas neuronas, que están conectadas entre sí a través de billones de sinapsis. Una sinapsis es esencialmente la interfaz entre dos neuronas a través de la cual las dos células nerviosas se comunican entre sí. Cuando aprendemos algo nuevo, las neuronas se envían señales eléctricas entre sí a través de las sinapsis, a medida que continuamos aprendiendo, las mismas neuronas siguen disparándose juntas y las conexiones entre ellas se hacen más fuertes, mientras que las conexiones entre las neuronas inactivas se vuelven más débiles.
Los procesos de aprendizaje en las redes neuronales artificiales son similares y, al alimentar estas redes con grandes cantidades de datos, se pueden entrenar para reconocer patrones en el lenguaje natural o en imágenes. Pero mientras que el cerebro es un maestro en el aprendizaje eficiente en energía, entrenar una gran red neuronal artificial requiere mucha potencia de cálculo y mucha energía. Entrenar una red neuronal artificial para que pueda producir resultados significativos también implica una cantidad significativa de intervención humana. Por lo general, estas redes artificiales se diseñan y configuran manualmente, y los numerosos parámetros implicados son ajustados y optimizados por expertos hasta que funcionan al nivel requerido. Aquí es donde los investigadores de Saarbrücken ponen en juego la «búsqueda de arquitectura neuronal» (NAS). «En lugar de diseñar las redes neuronales manualmente, automatizamos el proceso de optimización del diseño utilizando NAS», explica Sabine Janzen. «NAS nos permite examinar diferentes arquitecturas de red y optimizarlas para crear un modelo que ofrezca un alto rendimiento, eficiencia y costes reducidos».
Para probar estos modelos de IA más compactos en la práctica, el equipo de Wolfgang Maaß está trabajando junto con la empresa siderúrgica Stahl Holding Saar. El objetivo es enseñar a las redes neuronales artificiales a clasificar la chatarra de acero de manera eficiente. Para producir acero nuevo a partir de chatarra de acero, los productores necesitan chatarra de la calidad adecuada. Solo ciertos tipos de chatarra pueden reciclarse para la fabricación de aceros de alta calidad. Sin embargo, la chatarra de acero que se entrega a la planta de fundición es una mezcla de todos los tipos y debe clasificarse. La clasificación de la chatarra puede automatizarse, pero hasta ahora el modelo de IA es demasiado grande para ser práctico. «Hemos comprimido el modelo de clasificación visual de IA, haciéndolo más compacto y energéticamente eficiente. De hecho, en ciertos parámetros, el modelo más pequeño incluso funciona mejor, lo que hace que el proceso de reciclaje de acero sea más eficiente», afirma Janzen. Donde antes un enorme modelo de IA habría requerido mucha energía para funcionar, un modelo pequeño, personalizado y energéticamente eficiente es ahora capaz de realizar la misma tarea.
Los investigadores empiezan entrenando sus modelos con el conjunto de datos completo que contiene toda la información. Luego reducen los modelos de IA utilizando la destilación de conocimiento y redes neuronales especialmente compiladas para que los modelos solo contengan aquellos parámetros que son realmente necesarios para la tarea en cuestión. En este caso particular, el objetivo es crear una IA que tenga todo el conocimiento que necesita para poder analizar las imágenes de la cámara para clasificar la chatarra de acero que se entrega en el sitio.
El equipo de investigación de Saarbrücken también está trabajando con socios para esbozar un concepto y recopilar recomendaciones para centros de datos sostenibles y una IA energéticamente eficiente. «Hasta ahora ha sido difícil estimar cuánta energía se necesita para crear y operar un modelo de IA. Eso dificulta la planificación de las empresas», explica la estudiante de doctorado Hannah Stein, que está investigando estos modelos de IA energéticamente eficientes. «Actualmente estamos desarrollando una herramienta que proporciona previsiones fiables de la energía consumida y los costes asociados a los diferentes modelos de IA», afirma Stein. Los centros de datos y los usuarios de IA pueden utilizar esta información para planificar de forma más eficaz, identificar procesos ineficientes y tomar medidas correctivas según sea necesario, por ejemplo, programar cargas computacionales pesadas en momentos en que el precio de la electricidad es bajo.
La investigación que está llevando a cabo el profesor Wolfgang Maaß y su equipo fue seleccionada para el stand del Ministerio Federal de Asuntos Económicos y Acción Climática en la Feria de Hannover de este año. El equipo presentará los últimos resultados del proyecto ESCADE, financiado con fondos federales, que tiene su sede en el Centro Alemán de Investigación en Inteligencia Artificial (DFKI).
Antecedentes:
ESCADE (Inteligencia Artificial de Gran Escala y Eficiencia Energética para Centros de Datos Sostenibles) es un proyecto de tres años con un presupuesto de alrededor de 5 millones de euros financiado por el Ministerio Federal de Asuntos Económicos y Acción Climática (BMWK).
El proyecto se extenderá hasta finales de abril de 2026. El consorcio ESCADE está formado por el equipo de investigación dirigido por Wolfgang Maaß (Universidad del Sarre y DFKI), NT Neue Technologie AG, Stahl-Holding-Saar GmbH & Co. KGaA, SEITEC GmbH, la Universidad Tecnológica de Dresde, la Universidad de Bielefeld y el instituto de investigación aplicada austriaco Salzburg Research. https://escade-project.de

