Inteligencia artificial y lenguas originarias de México: un reto pendiente

por Iván Meza Ruiz
imágenes de Alexis Mata

La relación entre la inteligencia artificial y las lenguas originarias de nuestro país plantea desafíos complejos. Desde la preservación y revitalización de las mismas lenguas hasta los riesgos de apropiación o malinterpretación. Este artículo explora estas problemáticas y reflexiona sobre posibles caminos para que la IA pueda convertirse en una herramienta útil a fin de apoyar la diversidad lingüística y cultural.

La brecha digital en la diversidad lingüística

Desde fines de 2022 no hemos parado de hablar con las computadoras: nos resuelven dudas triviales, nos apoyan en nuestras labores, diagnostican nuestros síntomas, nos dan consejos y hasta escuchan nuestros secretos más oscuros. Tal y como se pronosticó, la IA cambió nuestra cotidianidad digital. Sin embargo, este cambio radical no ha permeado a todas las personas y particularmente, estos sistemas no son útiles en la mayoría de las siete mil lenguas que actualmente se encuentran en uso a nivel mundial. En México tenemos más de 300 (organizadas en 67 lenguas nacionales) y la funcionalidad es nula.

Beneficios de una tecnología inclusiva

No es difícil imaginar el impacto positivo que tendría que estos sistemas hablaran lenguas originarias de México: hablantes podrían tener acceso al cuerpo de conocimiento codificado en diversas fuentes y nosotros podríamos acceder al conocimiento de las comunidades originaras; se podrían crear herramientas para alcanzar acceso a la salud, justicia, educación e independencia económica. Se podrían construir agentes que apoyen la enseñanza o práctica de las lenguas a fin de que haya más hablantes; podríamos tener traducción en tiempo real de tal forma que ya no sea relevante qué lengua habla el interlocutor para tener conversaciones significativas y trascendentales. La cotidianidad de estos sistemas potenciales podría contribuir a erosionar aspectos de la discriminación que hace que estemos perdiendo el patrimonio lingüístico de México. 

Alexis Mata, Atardecer colorido en el desierto, 2025. Cortesía del artista.

[…] aspiramos a crear un esquema en el que las muestras y los datos pertenezcan a los hablantes y estas personas tengan mucho que decir sobre su aplicación y la tecnología que van a alimentar, es decir, queremos que estas muestras sean recolectadas en el marco de un esquema ético para beneficio de las comunidades.

Alexis Mata, Volar para observar, 2024. Cortesía del artista

La cotidianidad de [los sistemas de IA] potenciales podría contribuir a erosionar aspectos de la discriminación que hace que estemos perdiendo el patrimonio lingüístico de México.

El desafío de las muestras orales

Desde la tecnología tenemos la receta para que los sistemas comiencen a hablar las lenguas originarias de México. Sin embargo, las muestras lingüísticas son el ingrediente faltante. Con estas, se seguiría el mismo procedimiento que se utilizó para que los sistemas pasaran de hablar solo inglés a hablar español y decenas de otras lenguas. 

¿Entonces por qué no estamos recolectando estas muestras? A pesar de los esfuerzos por normalizar la escritura, el primer reto tiene que ver con la naturaleza oral de las lenguas originarias de México. Por eso, las muestras también deben ser orales, es decir, deben consistir en grabaciones que registren el habla. En una sociedad hipertecnológica como la nuestra, uno esperaría que existan múltiples grabaciones, sin embargo la realidad es que, debido a la exclusión histórica en nuestra sociedad, no existen aún suficientes registros de personas hablando su lengua. Cabe destacar que existen grabaciones asociadas a expresiones artísticas, pero en ellas no predomina el habla, lo que también da para pensar sobre nuestras prioridades como sociedad. 

Hacia un modelo ético y no extractivista

Un segundo reto es aspiracional, dado que no queremos reproducir los modelos extractivistas que se aplicaron para obtener las muestras de español necesarias. Por el contrario aspiramos a crear un esquema en el que las muestras y los datos pertenezcan a los hablantes y estas personas tengan mucho que decir sobre su aplicación y la tecnología que van a alimentar, es decir, queremos que estas muestras sean recolectadas en el marco de un esquema ético para beneficio de las comunidades. Ambos retos son gigantescos. 

Superar estos dos desafíos nos dará la posibilidad de reimaginar el rol de la IA en nuestra sociedad; pasar de un esquema impuesto que nos imagina como usuarios, a ser productores y tener control sobre la tecnología. Una vez que nuestras computadoras empiecen a hablar náhuatl, ayuuk, wixarika o alguna de las otras lenguas originarias, tendremos la posibilidad de desarrollar sistemas que impacten en nuestra sociedad. Somos nosotros los responsables del cambio radical, no la IA, y en consecuencia debemos hacer el esfuerzo, no la IA sola.

Alexis Mata, El espejo en el desierto, 2024. Cortesía del artista.

Alexis Mata,  La tarde de cactus, 2024. Cortesía del artista.

Iván Meza Ruiz es investigador asociado en el Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas de la UNAM. Ingeniero en computación por la UNAM, maestro y doctor por la Universidad de Edimburgo. Especializado en la intersección entre el lenguaje humano y el cómputo usando técnicas de inteligencia artificial y aprendizaje profundo. Ha participado en más de veinte proyectos de investigación, es autor de más de cien artículos en el campo y ha sido ponente en diferentes foros nacionales e internacionales. Miembro del Sistema Nacional de Investigadores de México.

Alexis Mata (Ciudad de México, 1981) inició su exploración artística con intervenciones en espacios públicos y urbanos, buscando generar crítica social y diálogo en un país marcado por la desigualdad y la violencia. El carácter efímero de estas acciones lo llevó a experimentar con el collage, la pintura, el dibujo y la instalación, y posteriormente a explorar las intersecciones entre lo digital y lo análogo. Mediante el escaneo, la manipulación y la edición digital, reflexiona sobre la transformación de la información al migrar entre formatos. Su obra reciente dialoga con la inteligencia artificial para explorar el inconsciente colectivo y la relación entre sueño, memoria y tecnología. www.alexis-mata.com | Instagram @alexismataaaa