Así es ALIA, la inteligencia artificial española desarrollada por el Gobierno
NOTI-AMERICA.COM | ESPAÑA
El presidente del Gobierno, Pedro Sánchez, ha aprovechado la clausura del acto ‘HispanIA 2040: cómo la inteligencia artificial mejorará nuestro futuro’ para anunciar el lanzamiento en abierto para todos los usuarios de ALIA, «el modelo fundacional de inteligencia artificial (IA) en español». Sánchez ya avanzó la intención del Ejecutivo de impulsar el desarrollo de esta familia de modelos de lenguaje de IA en la inauguración de la última edición del Mobile World Congress. El proyecto está liderado por el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS), que gestiona el MareNostrum 5, uno de los superordenadores más potentes del mundo, que ha sido fundamental en el entrenamiento del modelo.
ALIA es un gran modelo de lenguaje de inteligencia artificial, entrenado en español, catalán, gallego, valenciano y euskera. El proyecto está completamente financiado con fondos públicos y promete proporcionar un servicio de interés general, pero ¿qué implica para la ciudadanía?
ALIA se define en su propia web como «la primera infraestructura pública europea, abierta y multilingüe» de inteligencia artificial. Su apertura es precisamente una de las características que diferencian el modelo de otros disponibles en la red. «En los modelos cerrados, la compañía tiene el control en todos los procesos. Puede ser más o menos transparente, pero está supeditado a lo que diga la empresa», explica el cofundador de la Asociación Española de Inteligencia Artificial Responsable y profesor de la Universitat Oberta de Catalunya (UOC), Josep Curto.
Los modelos pueden ser abiertos parcialmente o en su totalidad. Destacan tres elementos clave: el conjunto de datos, el modelo y los pesos. En línea con los principios de la legislación europea en materia de inteligencia artificial, el proyecto presenta un modelo totalmente abierto. En ALIA Kit, los interesados pueden acceder a toda la información, como la metodología, la documentación y los conjuntos de datos de entrenamiento y evaluación, lo que refuerza su transparencia.
Para Curto, una de las grandes ventajas de los modelos abiertos es que permiten a los investigadores identificar sus puntos fuertes y débiles. De esta manera, un mayor número de expertos pueden validarlos y alertar de los problemas, para resolverlos con efectividad. La explicabilidad del sistema es otro de los factores a tener en cuenta. Un mayor acceso a su documentación, facilita la comprensión del modelo.
Sánchez ha anunciado en su intervención que ya se encuentran a disposición todos los usuarios «los primeros modelos de ALIA». A pesar de que el proyecto se ha presentado como un modelo de lenguaje, es, en realidad, una familia de modelos. Lo que varía de uno a otro, explica Curto, es la cantidad de parámetros con los que se ha entrenado: «Al final, se traduce en su potencia de predicción, si están ayudados por distintos conjuntos de datos y si tienen más o menos complejidad de estructura».
El modelo general se ha entrenado para múltiples usos, pero, para casos específicos, no es suficiente. Es preferible optar por modelos diseñados en concreto para esa situación. Apple Intelligence —la inteligencia artificial de Apple— es un buen ejemplo, cuenta Curto: «Cuando activas la IA no te descargas uno, sino varios modelos pequeños que están optimizados para cada función. Por ejemplo, uno se encarga de borrar a las personas de las imágenes, otro de corregir la redacción». Además, explica, se accede desde distintas interfaces de entrada, es decir, no se presenta una única herramienta capaz de cumplir con todas las demandas del usuario.
Algo similar sucederá con ALIA. El presidente ha señalado que ya «están en marcha los trabajos para aplicarla a dos proyectos piloto». El primero de ellos, se trata de un «chatbot interno, que agilizará el trabajo de la Agencia Tributaria y su atención ciudadana». Por otro lado, se implementará a la medicina de atención primaria, «para un diagnóstico precoz y más preciso de las insuficiencias cardíacas».
Contar con distintos modelos permite adaptar cada uno de ellos a su contexto. «No siempre es necesario utilizar el modelo más grande, dependerá del caso de uso. Uno pequeño está más afinado para el uso específico, se ejecuta más rápido y requiere menos recursos», subraya Curto. El experto recuerda que, si toda la familia está abierta, los interesados podrán descargar cualquiera de los modelos y usarlo dentro de sus sistemas. De este modo, podrán elegir el que más se adecúe a sus necesidades y modificarlo para ajustarlo a su ámbito.
Otro de los elementos definitorios de ALIA es su carácter multilingüe. La familia de modelos soporta todas las lenguas de España, con la colaboración de la Real Academia Española (RAE) y la Asociación de Academias de la Lengua Española. La IA de corte lingüístico se entrena con corpus, que habitualmente proceden de bases de datos disponibles en internet. En ellas, abunda el contenido en inglés, pero escasea en otras lenguas. El entrenamiento en las lenguas cooficiales del estado aporta contexto y riqueza al sistema. «Se trata de que los modelos de lenguaje no tengan que hacer un esfuerzo extra para soportar, por ejemplo, el gallego o el catalán», aclara Curto.
No es la primera iniciativa de este tipo. El Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC) ya ha coordinado el proyecto ILENIA (Impulso de las Lenguas en Inteligencia Artificial), que trabaja también sobre la IA. En 2022, el mismo centro presentó MarIA, una familia de modelos de lenguaje masivos en español. La RAE impulsó también en 2019 el proyecto LEIA (Lengua Española e Inteligencia Artificial), enfocado a proyectos de verificación ortográfica o responder consultas lingüísticas.
Sánchez en su intervención ha repasado el potencial de la IA y ha enfatizado la necesidad de situar a España a la cabeza de la innovación. Todos los Gobiernos, destaca Curto, compiten en el ámbito de la inteligencia artificial para alcanzar la «soberanía tecnológica». El experto señala tres aspectos fundamentales para dominar esta carrera. El primero de ellos es la capacidad de cómputo. Considera que, en este sentido, es crucial la labor del BSC. Cree necesario, además, diseñar conjuntos de datos dentro del país, ya que «permite que España tenga capacidad en datos que son propios y se han generado de forma específica para nuestro contexto».
El tercer aspecto es la capacidad de innovación. Son muchos los Gobiernos que trabajan en esta línea. Curto aclara que el mecanismo es diferente en Europa, al contar con una regulación que establece una Oficina de Inteligencia Artificial en Europa y en los distintos países, como España: «Derivado de la regulación, surgen las dudas sobre cómo innovar. Esta familia da posibilidades a pequeñas empresas que no tienen capacidad de entrenamiento desde cero. Con este modelo, pueden implementar mecanismos de innovación».
Comentarios recientes