Nuestras necesidades de cómputo de inteligencia artificial (IA) aumentarán drásticamente durante la próxima década a medida que abramos nuevos caminos en la investigación de IA, ofrezcamos más aplicaciones y capacidades de IA de vanguardia en toda nuestra familia de aplicaciones y construyamos nuestra visión a largo plazo para el metaverso.
Estamos siguiendo un plan ambicioso para construir la próxima generación de la infraestructura Meta AI, y hoy compartimos algunos detalles sobre nuestro progreso.
Esto incluye nuestro primer chip de silicio dedicado para ejecutar modelos de IA, un nuevo diseño de centro de datos optimizado para IA y la segunda fase de nuestra supercomputadora de 16 000 GPU para la investigación de IA. Estos esfuerzos, y proyectos adicionales aún en curso, nos permitirán desarrollar modelos de IA más grandes y complejos y luego implementarlos de manera eficiente a escala. La IA ya está en el corazón de nuestros productos, lo que permite mejor personalización, productos más seguros y honestosY experiencia más rica además de ayudar a las empresas a llegar a las audiencias que más les importan.
Incluso estamos repensando cómo programamos mediante la implementación de CodeCompose, un asistente de programación generativo basado en IA que hemos desarrollado para que nuestros desarrolladores sean más productivos a lo largo del ciclo de vida del desarrollo de software.
Al repensar cómo innovamos en nuestra infraestructura, estamos construyendo una base escalable para desbloquear nuevas oportunidades en áreas como IA generativa y el metaverso.
IA en el corazón de nuestra infraestructura
Desde que abrimos nuestro primer centro de datos en 2010, hemos construido la infraestructura global que ahora impulsa a más de tres mil millones de personas que usan nuestra familia de aplicaciones todos los días. La IA ha sido una parte importante de estos sistemas a lo largo de los años, desde Sur grande equipos en 2015 a desarrollar Antorcha y nuestro supercomputadora para investigación de IA.
Ahora estamos mejorando nuestra infraestructura de una nueva manera:
- MTIA (acelerador de inferencia y metaaprendizaje): Esta es nuestra propia familia de chips aceleradores especializados diseñados para cargas de trabajo de inferencia. MTIA proporciona más potencia de procesamiento y eficiencia que una CPU y está ajustado para nuestras cargas de trabajo internas. Al implementar chips MTIA y GPU, ofreceremos un mayor rendimiento, una latencia más baja y una mayor eficiencia para cada carga de trabajo.
- Centro de datos de última generación: El diseño de nuestro centro de datos de próxima generación admitirá nuestros productos actuales, lo que permitirá que las futuras generaciones de hardware de IA se utilicen tanto para capacitación como para inferencia. Este nuevo centro de datos tendrá un diseño optimizado para IA, admitirá hardware de IA refrigerado por líquido y alto rendimiento. Una red de IA que conecta miles de chips de IA para crear clústeres de entrenamiento de IA a escala de centro de datos. También será más rápido y económico de construir, y complementará otro hardware nuevo, como nuestra primera solución ASIC interna, ASHI, que está diseñado para admitir las cargas de video cada vez mayores en Meta.
- Supercúmulo de investigación de supercomputadoras de IA (RSC): Meta RSK, que creemos que es una de las supercomputadoras de IA más rápidas del mundo, se creó para entrenar la próxima generación de grandes modelos de IA con nuevas herramientas de realidad aumentada, sistemas de comprensión de contenido, tecnología de traducción en tiempo real y más. Incluye 16 000 GPU, a las que se puede acceder a través de una estructura de red Clos de tres capas que proporciona un rendimiento completo para cada uno de los 2000 sistemas de entrenamiento.
Beneficios de una pila integrada de extremo a extremo
El diseño personalizado de gran parte de nuestra infraestructura nos permite optimizar la experiencia de extremo a extremo desde la capa física hasta la capa virtual, desde la capa de software hasta la experiencia real del usuario.
Diseñamos, construimos y operamos todo, desde centros de datos hasta hardware de servidor y los sistemas mecánicos que hacen que todo funcione. Debido a que controlamos la pila de arriba a abajo, podemos personalizarla para nuestras necesidades específicas. Por ejemplo, podemos acomodar fácilmente GPU, CPU, redes y almacenamiento si eso respaldara mejor nuestras cargas de trabajo. Si esto significa que, como resultado, necesitamos diferentes soluciones de alimentación o refrigeración, podemos repensar estos diseños como parte de un único sistema holístico.
Esto será cada vez más importante en los próximos años. Durante la próxima década, veremos una mayor especialización y personalización del diseño de chips, la creación de una infraestructura de IA especializada para cargas de trabajo específicas, nuevos sistemas y herramientas para la implementación a gran escala y un soporte de diseño y productos más eficiente. Todo esto dará lugar a modelos cada vez más complejos basados en las últimas investigaciones y productos que darán acceso a esta nueva tecnología a personas de todo el mundo.
Siempre nos enfocamos en brindar valor e impacto a largo plazo para guiar nuestra visión de infraestructura. Creemos que nuestro historial de construcción de infraestructura de clase mundial nos permite continuar liderando el campo de la inteligencia artificial durante la próxima década y más allá.
Aprender más acerca de nuestra inversión en IA.