Meta de Zuckerberg presenta Llama 3.1, el modelo de IA más capaz hasta la fecha.
Meta de Mark Zuckerberg, lanzó Llama 3.1, el modelo de inteligencia artificial más avanzado y accesible hasta la fecha. Este lanzamiento reafirma el compromiso de Meta con la inteligencia artificial de código abierto, destacando los beneficios que esto trae para los desarrolladores, la empresa y el mundo entero.
Llama 3.1 introduce mejoras significativas, como una longitud de contexto ampliada a 128K, soporte en ocho idiomas y el modelo Llama 3.1 405B, el primer modelo de IA de código abierto de nivel frontera. Este modelo ofrece una flexibilidad y capacidades avanzadas sin precedentes, permitiendo aplicaciones innovadoras como la generación de datos sintéticos y la destilación de modelos.
Meta sigue desarrollando Llama como un sistema completo, añadiendo componentes que trabajan en conjunto con el modelo principal, incluyendo un sistema de referencia. Este enfoque busca empoderar a los desarrolladores con herramientas para crear agentes personalizados y nuevos tipos de comportamientos agentivos. Para garantizar la construcción responsable de estas herramientas, se han introducido nuevas medidas de seguridad, como Llama Guard 3 y Prompt Guard. Además, Meta ha lanzado una API de Llama Stack para facilitar el uso de los modelos Llama por parte de proyectos de terceros.
El ecosistema de Llama 3.1 cuenta con el respaldo de más de 25 socios, entre ellos AWS, NVIDIA, Databricks, Groq, Dell, Azure, Google Cloud y Snowflake, que ofrecen servicios desde el primer día.
Llama 3.1 405B se destaca por ser el primer modelo de código abierto que rivaliza con los mejores modelos de IA en el mercado en cuanto a capacidades avanzadas. Además, Meta ha mejorado versiones anteriores de sus modelos, como los modelos 8B y 70B, ahora multilingües y con una longitud de contexto ampliada, soportando casos de uso avanzados como la resumación de textos largos y agentes conversacionales multilingües. Estos modelos están disponibles para descarga en llama.meta.com y Hugging Face.
La evaluación de rendimiento de Llama 3.1 en más de 150 conjuntos de datos, junto con extensas evaluaciones humanas, demuestra que el modelo es competitivo con los principales modelos del mercado, incluyendo GPT-4 y Claude 3.5.
Para entrenar Llama 3.1 405B, Meta optimizó su infraestructura de entrenamiento y utilizó más de 16 mil GPUs H100, estableciendo un nuevo estándar en la escala de entrenamiento de modelos de IA. Este modelo adopta un enfoque de transformador de solo decodificador y un procedimiento iterativo de post-entrenamiento, mejorando tanto la cantidad como la calidad de los datos utilizados.
Llama 3.1 también mejora la utilidad, calidad y capacidad de seguimiento de instrucciones del modelo, garantizando altos niveles de seguridad. La generación de datos sintéticos y el ajuste fino supervisado permiten un rendimiento superior en todas las capacidades del modelo.
El objetivo de Meta es que los modelos Llama funcionen como parte de un sistema completo que permita a los desarrolladores diseñar ofertas personalizadas. Con este lanzamiento, Meta proporciona un sistema de referencia completo con aplicaciones de muestra y nuevos componentes como Llama Guard 3 y Prompt Guard, disponibles para la comunidad. También se ha lanzado una solicitud de comentarios en GitHub para "Llama Stack", un conjunto de interfaces estandarizadas para construir componentes y aplicaciones agentivas, fomentando la interoperabilidad en el ecosistema.
Meta está emocionada de ver las innovaciones que la comunidad desarrollará con Llama 3.1, y continúa en su misión de promover la inteligencia artificial de código abierto para un desarrollo más equitativo y seguro de esta tecnología.