Introdución a AlphaTensor

 

AlphaTensor

        AlphaTensor, la inteligencia artificial de DeepMind que descubre  los algoritmos novedosos, eficientes y comprobablemente correctos para tareas fundamentales como la multiplicación de dos o mas matrices.La misión de DeepMind de hacer avanzar la ciencia y resolver los problemas más fundamentales mediante la IA. AlphaTensor, se basa en AlphaZero, un agente que ha demostrado un rendimiento sobrehumano en juegos de mesa, como el ajedrez, el Go y el shogi , y este trabajo muestra el viaje de AlphaZero desde jugar juegos hasta abordar problemas matemáticos sin resolver por primera vez. 

La multiplicación de matrices es una de las operaciones más simples en álgebra, pero esta humilde operación matemática tiene una enorme influencia en el mundo digital contemporáneo y presente en la informática moderna.  Esta operación se utiliza para procesar imágenes en teléfonos inteligentes, reconocer comandos de voz, generar gráficos para juegos de computadora, ejecutar simulaciones para predecir el clima, comprimir datos y videos para compartir en Internet y mucho más.

Uno de los logros en los avances de multiplicacion de matrices fue el aporte de él matemático alemán Volker Strassen sorprendió al demostrar que existen mejores algoritmos.

Alphatensor consiste en un juego de un solo jugador donde el objetivo es encontrar un algoritmo correcto de multiplicación de matrices. AlphaTensor mejora gradualmente con el tiempo, el redescubriendo algoritmos históricos de multiplicación de matrices rápidas como el de Strassen, superando finalmente el reino de la intuición humana y descubriendo algoritmos más rápidos de lo que se conocía anteriormente.

Cesar Cruz Rojo


Como estado del arte (o sota), el algoritmo tradicional que se enseña en la escuela multiplica una matriz de 4x5 por 5x5 usando 100 multiplicaciones, y este número se redujo a 80 con ingenio humano y AlphaTensor ha encontrado algoritmos usando solo 76 multiplicaciones. 

AlphaTensor mejora el algoritmo de dos niveles de Strassen y estos algoritmos para multiplicar matrices pequeñas se pueden usar como primitivas para multiplicar matrices mucho más grandes de tamaño arbitrario. 

AlphaTensor para encontrar específicamente algoritmos que sean rápidos en un hardware determinado, como GPU Nvidia V100 y Google TPU v2, que son indispensables para el entrenamiento e inferencia en modelos de deep learning y en  muchas tareas computacionales.


Comprender este espacio puede desbloquear nuevos resultados para ayudar a determinar la complejidad asintótica de la multiplicación de matrices, uno de los problemas abiertos más fundamentales en informática.

Detalles en: https://www.nature.com/articles/s41586-022-05172-4