14 de febrero de 2015
Proyecto pionero
En el contexto del proyecto LatamGGPT, se ha realizado un análisis introductorio que desvela una colaboración más amplia de lo que inicialmente se podría haber pensado. Aunque se ha presentado en varios medios como un proyecto chileno, en realidad, es un esfuerzo colaborativo que involucra a al menos nueve países de América Latina. Este modelo de lenguaje no solo representa a Chile, sino que simboliza una alianza regional.
El liderazgo de este ambicioso proyecto recae en el Centro Nacional de Inteligencia Artificial de Chile, que coordina y dirige los esfuerzos para integrar diversas perspectivas y conocimientos. Este enfoque colectivo busca capturar y reflejar la diversidad cultural y lingüística de la región.
«Es un modelo de lenguaje que incluye la participación, no solo de Chile, sino que al menos nueve países por ahora de América Latina.».
Motivaciones Detrás de Latam GPT
La creación de LatamGPT surge con el propósito de reflejar la rica cultura, historia y expresiones de la región latinoamericana, capturando su identidad única. A pesar del dominio en inteligencia artificial por parte de potencias como Estados Unidos y China, el objetivo aquí no es competir directamente con estos gigantes, sino ofrecer una alternativa que comprenda y represente las particularidades del contexto latinoamericano.
Muchos podrían preguntarse por qué Chile toma la iniciativa en un campo tan dominado. La respuesta radica en el deseo de crear un modelo que no solo interprete datos, sino que entienda profundamente las costumbres, historias locales y vocabulario propio de Latinoamérica.
«Sabemos que existen grandes modelos de lenguaje internacionales como ChatGPT, Gemini, Anthropic.»
Los modelos internacionales como ChatGPT y otros han avanzado significativamente desde 2017; sin embargo, presentan dificultades al responder sobre temas específicos de la región. La motivación detrás del proyecto LatamGPT es precisamente llenar este vacío. El equipo detrás de este proyecto busca desarrollar una herramienta que capture con precisión las sutilezas y matices del lenguaje y cultura latinoamericana.
«El equipo de CENIA fue un poco movido por para liderar un proyecto, para crear algo que realmente entienda nuestra región de manera un poco más profunda.»
Esta iniciativa no solo busca ser una contribución tecnológica, sino también un puente cultural que permita a las futuras generaciones comprender mejor su entorno y herencia cultural a través del uso avanzado del lenguaje.
Algunos detalles técnicos.
El proyecto LatamGPT, aunque se instala en Chile, está diseñado para toda Latinoamérica, lo que refleja su nombre preliminar. Este modelo es de gran escala, con cincuenta mil millones de parámetros. Para ponerlo en perspectiva, el modelo Llama 3 cuenta con setenta mil millones de parámetros. Los parámetros son los valores internos que se ajustan durante el entrenamiento del modelo para aprender y representar patrones a partir de los datos. A mayor cantidad de parámetros, mayor es la capacidad del modelo para capturar información compleja y generar respuestas precisas.
De ahí su nombre preliminar, que es LatamGPT.
El proceso de entrenamiento del LatamGPT se llevará a cabo en un clúster de cómputo que está siendo instalado en la Universidad de Tarapacá. Un clúster es un conjunto de computadoras conectadas en red que operan juntas como una sola unidad, permitiendo distribuir tareas y aumentar la capacidad de procesamiento para proyectos exigentes. Este clúster contará con nodos equipados con tarjetas Nvidia que tienen ciento cuarenta y un gigabytes de memoria cada una, lo cual es muy potente y significativo para nuestra región.
Colaboración latinoaméricana
El proyecto LatamGPT se destaca por su amplia colaboración internacional, abarcando convenios en nueve países de Latinoamérica. Estos acuerdos incluyen ministerios de ciencias, universidades, y diversas instituciones de investigación. Un ejemplo notable es el acuerdo con el consejo de rectores de las universidades chilenas, lo que proporciona acceso a valiosos repositorios académicos. Esto no solo amplía el alcance del proyecto, sino que también enriquece la calidad y profundidad del modelo al integrar una vasta cantidad de datos regionales.
«La inversión supera también los diez millones de de dólares.»
La inversión significativa en estos convenios refleja un fuerte compromiso por parte de los participantes, asegurando que el modelo tenga una perspectiva más profunda sobre la región.
Además, el proyecto aborda la soberanía tecnológica. La dependencia actual en las grandes tecnológicas de Estados Unidos, Asia y Europa plantea riesgos si se restringe el acceso a tecnologías avanzadas por razones económicas o políticas. Contar con un modelo propio y una infraestructura independiente ofrece control sobre los datos y garantiza la continua capacidad para desarrollar aplicaciones de inteligencia artificial en la región.
La calidad y gobernanza de los datos es otro pilar fundamental. Se realiza un riguroso proceso de filtrado y curación para asegurar que solo la información más precisa se utilice en el entrenamiento del modelo. Cada institución tiene la libertad de decidir cómo compartir sus datos, promoviendo así un entorno más transparente y confidencial.
«Se está realizando un trabajo muy cuidadoso de filtrado, por lo que me comentan, ¿cierto? Limpieza, curación de la información que se usará en el entrenamiento.»
Este enfoque minucioso no solo mejora la fiabilidad del modelo sino que también fortalece el compromiso con la transparencia y confidencialidad en todo el proceso.
Participación comunitaria y perspectivas futuras
La participación de la comunidad es un aspecto fundamental en el desarrollo de proyectos tecnológicos, y LatamGPT no es la excepción. Se han planteado planes para organizar un hackathon, un evento colaborativo en el que los participantes podrán interactuar con el modelo y contribuir a su mejora. Este tipo de eventos no solo sirve para probar y refinar el modelo, sino que también fomenta la participación activa de la comunidad en su desarrollo.
El hackathon está diseñado para invitar a individuos a colaborar en el ajuste del modelo, mejorando su alineamiento y seguridad. En inglés, este proceso se refiere como «DPO» (Data Protection Officer), que busca enseñar al modelo a distinguir respuestas adecuadas de aquellas que no lo son, evitando sesgos, información falsa o contenido inapropiado. Este enfoque no solo robustece la inteligencia artificial, sino que también involucra a la comunidad de manera significativa.
La involucración comunitaria asegura que el modelo sea más confiable y refleje mejor las necesidades y expectativas del público al cual está destinado. Sin embargo, es importante mantener una mirada crítica sobre estos proyectos. Aunque generan entusiasmo y asombro por su potencial impacto, especialmente en el ámbito educativo y cultural, también es necesario abordar las críticas constructivas que surgen.
En países como Chile, a menudo se subestima el valor de los proyectos locales. Sin embargo, reconocer su potencial es esencial para fomentar un ambiente más innovador y colaborativo. Con una crítica constructiva e informada se pueden perfeccionar estos proyectos para maximizar sus beneficios.
El futuro de LatamGPT luce prometedor con estas iniciativas comunitarias. La continua colaboración e innovación son clave para asegurar su éxito y relevancia en los años venideros.
Conclusiones y posible impacto en la educación
Al llegar al final de nuestra exploración sobre el potencial de LatamGPT, es importante reflexionar sobre el impacto que este modelo puede tener en la educación en Latinoamérica, especialmente en Chile. A diferencia de los modelos internacionales que a menudo emplean datos globales poco contextualizados, un modelo latinoamericano podría ofrecer material pedagógico más alineado con nuestras historias, lenguas y necesidades curriculares. Esto no solo mejora la pertinencia educativa sino que también promueve un aprendizaje más significativo para los estudiantes de la región.
Tener la soberanía, me gustó mucho esa palabra, soberanía tecnológica creo que es importante para la región.
Es esencial construir herramientas que comprendan verdaderamente nuestros contextos y sirvan como inspiración para nuevas metodologías educativas. En este sentido, LatamGPT no es solo otra inteligencia artificial; es una oportunidad para avanzar hacia una soberanía tecnológica regional.