La entrada de AMD en el terreno de los modelos de lenguaje de gran tamaño, promete cambiar el panorama de la inteligencia artificial para siempre. AMD, rival directo de Nvidia, ha lanzado OLMo, su primer LLM de código abierto, con un diseño de 1.000 millones de parámetros, entrenado en las increíblemente poderosas GPU Instinct MI250.
Este modelo busca posicionarse como una alternativa sólida, para aplicaciones de IA de alto rendimiento y accesibilidad, y ofrece la posibilidad de implementarse, tanto en centros de datos, como en equipos personales con procesadores AMD Ryzen AI equipados, por supuesto, aquellos con unidades de procesamiento neural, las ultimas joyas de este gigante de la tecnología.
Código abierto y acceso total para desarrolladores
AMD ha decidido hacer públicos todos los componentes esenciales del proyecto OLMo, incluidos los datos, pesos y procesos de entrenamiento, permitiendo a los desarrolladores replicar y mejorar el modelo en sus propios entornos.
Esta estrategia es particularmente importante en un mercado dominado por plataformas de código cerrado, ya que permite a los usuarios de AMD aprovechar el modelo de forma libre y adaptarlo a sus necesidades, incentivando la innovación y que vengan mejoras a este modelo en el corto plazo.
Desempeño destacado de AMD OLMo
Entrenado en un conjunto de datos de 1,4 billones de tokens utilizando 65 procesadores en 17 nodos, OLMo ha demostrado un rendimiento notable en pruebas de referencia.
En comparación con otros modelos similares, como OpenELM-1_1B y TinyLlama-1.1B OLMo mostró ventajas en precisión de razonamiento y comprensión multitarea, con mejoras de hasta 17,32% en la evaluación.
Su variante más poderosa, el AMD OLMo 1B SFT DPO se posicionó entre los mejores modelos de chat de código abierto, superándolos en promedio por un 3,60%.
Pruebas de IA ética y responsable
AMD también priorizó las pruebas de ética en la IA, evaluando OLMo en métricas como lenguaje tóxico, imparcialidad y veracidad. Estos resultados mostraron que el modelo mantiene un desempeño responsable, alineándose con los estándares éticos de la industria actualmente.Con esta innovadora entrada, AMDno solo compite con uno de los gigantes del mundo de la IA, Nvidia, sino que también, abre nuevas oportunidades para los desarrolladores que buscan un ecosistema accesible y de alto rendimiento en la inteligencia artificial, que también les permita desarrollar nuevas aplicaciones, sin tener que pasar por los costosos filtros de las grandes tecnológicas, que actualmente tienen el monopolio de la IA.
AMD entra de lleno en la IA con su primer LLM https://t.co/ODfZnRIGLU
— Franz Systems (@SystemsFranz) November 8, 2024