En el vertiginoso mundo de la tecnología, la inteligencia artificial (IA) no solo está transformando la forma en que interactuamos con las máquinas, sino que también está revolucionando la creación de las propias máquinas: los chips. Un avance significativo en este campo es AlphaChip, un método de aprendizaje por refuerzo desarrollado por Google que ha acelerado y optimizado el diseño de chips, generando diseños «sobrehumanos» que se utilizan en hardware en todo el mundo.
En 2020, Google presentó un preprint que introducía este innovador método de aprendizaje por refuerzo para el diseño de layouts de chips, que posteriormente se publicó en Nature y se liberó como código abierto. Recientemente, se ha publicado un apéndice en Nature que profundiza en el método y su impacto en el campo del diseño de chips, acompañado del lanzamiento de un checkpoint pre-entrenado, compartiendo los pesos del modelo y anunciando su nombre oficial: AlphaChip.
La IA Diseñando la IA: Un Círculo Virtuoso
Los chips de computadora han impulsado un progreso notable en la IA, y ahora AlphaChip devuelve el favor al utilizar la IA para acelerar y optimizar el diseño de chips. Este método se ha empleado para diseñar layouts de chips que superan las capacidades humanas en las últimas tres generaciones del acelerador de IA personalizado de Google, la Unidad de Procesamiento Tensorial (TPU).
AlphaChip representa uno de los primeros enfoques de aprendizaje por refuerzo aplicados a un problema de ingeniería del mundo real. Genera layouts de chips sobrehumanos o comparables en horas, en lugar de las semanas o meses que requeriría el esfuerzo humano, y sus diseños se utilizan en chips de todo el mundo, desde centros de datos hasta teléfonos móviles. Como afirma SR Tsai, Vicepresidente Senior de MediaTek, «El innovador enfoque de IA de AlphaChip revoluciona una fase clave del diseño de chips».
¿Cómo Funciona AlphaChip?
Diseñar un layout de chip no es una tarea sencilla. Los chips de computadora constan de numerosos bloques interconectados, con capas de componentes de circuitos, todos conectados por cables increíblemente delgados. Además, existen muchas restricciones de diseño complejas e interrelacionadas que deben cumplirse simultáneamente. Debido a su enorme complejidad, los diseñadores de chips han luchado por automatizar el proceso de floorplanning de chips durante más de sesenta años.
De forma similar a AlphaGo y AlphaZero, que aprendieron a dominar los juegos de Go, ajedrez y shogi, AlphaChip se construyó para abordar el floorplanning de chips como una especie de juego.
Comenzando desde una cuadrícula en blanco, AlphaChip coloca un componente de circuito a la vez hasta que se han colocado todos los componentes. Luego, se le recompensa en función de la calidad del layout final. Una novedosa red neuronal gráfica «basada en bordes» permite a AlphaChip aprender las relaciones entre los componentes interconectados del chip y generalizar entre chips, lo que permite que AlphaChip mejore con cada layout que diseña.
Usando IA para Diseñar los Chips Aceleradores de IA de Google
AlphaChip ha generado layouts de chips sobrehumanos utilizados en cada generación de las TPU de Google desde su publicación en 2020. Estos chips hacen posible escalar masivamente los modelos de IA basados en la arquitectura Transformer de Google.
Las TPU son el corazón de los potentes sistemas de IA generativa de Google, desde modelos de lenguaje grandes, como Gemini, hasta generadores de imágenes y video, Imagen y Veo. Estos aceleradores de IA también son fundamentales para los servicios de IA de Google y están disponibles para usuarios externos a través de Google Cloud.
Para diseñar los layouts de las TPU, AlphaChip primero practica con una amplia gama de bloques de chips de generaciones anteriores, como bloques de red en chip e interchip, controladores de memoria y buffers de transporte de datos. Este proceso se denomina pre-entrenamiento. Luego, se ejecuta AlphaChip en los bloques de TPU actuales para generar layouts de alta calidad. A diferencia de los enfoques anteriores, AlphaChip mejora y se vuelve más rápido a medida que resuelve más instancias de la tarea de colocación de chips, de forma similar a como lo hacen los expertos humanos.
Con cada nueva generación de TPU, incluida la última, Trillium (sexta generación), AlphaChip ha diseñado mejores layouts de chips y ha proporcionado una mayor parte del floorplan general, acelerando el ciclo de diseño y produciendo chips de mayor rendimiento.
El Impacto Más Amplio de AlphaChip
El impacto de AlphaChip se puede observar a través de sus aplicaciones en Alphabet, la comunidad de investigación y la industria del diseño de chips. Además de diseñar aceleradores de IA especializados como las TPU, AlphaChip ha generado layouts para otros chips en Alphabet, como los procesadores Google Axion, las primeras CPU de centro de datos de propósito general basadas en Arm.
Organizaciones externas también están adoptando y construyendo sobre AlphaChip. Por ejemplo, MediaTek, una de las principales empresas de diseño de chips del mundo, extendió AlphaChip para acelerar el desarrollo de sus chips más avanzados, al tiempo que mejoraba la potencia, el rendimiento y el área del chip.
AlphaChip ha desencadenado una explosión de trabajo en IA para el diseño de chips y se ha extendido a otras etapas críticas del diseño de chips, como la síntesis lógica y la selección de macros. Como afirma el profesor Siddharth Garg de la NYU Tandon School of Engineering, «AlphaChip ha inspirado una línea de investigación completamente nueva sobre el aprendizaje por refuerzo para el diseño de chips, que abarca todo el flujo de diseño, desde la síntesis lógica hasta el floorplanning, la optimización del tiempo y más allá».
Creando los Chips del Futuro
Se cree que AlphaChip tiene el potencial de optimizar cada etapa del ciclo de diseño de chips, desde la arquitectura de la computadora hasta la fabricación, y de transformar el diseño de chips para hardware personalizado que se encuentra en dispositivos cotidianos como teléfonos inteligentes, equipos médicos, sensores agrícolas y más.
Las futuras versiones de AlphaChip ya están en desarrollo y se espera trabajar con la comunidad para continuar revolucionando esta área y lograr un futuro en el que los chips sean aún más rápidos, económicos y energéticamente eficientes. La convergencia entre la creatividad humana y la eficiencia computacional marca el inicio de una nueva era en el desarrollo tecnológico.
https://deepmind.google/discover/blog/how-alphachip-transformed-computer-chip-design