El debate global sobre los alcances de la inteligencia artificial (IA) sigue vigente, pero su utilidad ha encontrado un propósito noble: la salvaguarda de las lenguas indígenas en México. Esta tecnología se ha convertido en un aliado estratégico para rescatar idiomas originarios que se encuentran bajo una seria amenaza de desaparición.
Un equipo de especialistas pertenecientes al Departamento de Ciencias de la Computación, dentro del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas de la UNAM, encabeza un ambicioso proyecto. El objetivo principal es emplear herramientas digitales para frenar el olvido de estos idiomas, especialmente de aquellos que ya no poseen hablantes activos en la actualidad.
La situación actual del patrimonio lingüístico en tierras mexicanas es sumamente preocupante. El país registra un total de 68 lenguas nativas, las cuales se distribuyen en 11 familias lingüísticas y cuentan con 364 variantes distintas.
De acuerdo con las investigaciones de Iván Vladimir Meza Ruiz, académico de la UNAM, el número de personas que se comunican en estas lenguas ha sufrido una caída drástica. Mientras que en el año 1930 representaban el 15% de la población total, para el censo de 2020 la cifra se redujo a tan solo el 6.2%.

Esta tendencia a la baja se acentúa en las generaciones más jóvenes, quienes han dejado de practicar estas lenguas casi por completo. Como resultado, la mayor parte de la población que aún conserva este conocimiento está compuesta por adultos mayores.
El investigador Meza Ruiz señala que la aplicación de la IA permitiría conservar la vitalidad de estos idiomas originarios
“aunque sea de manera artificial”
, considerando que muchas de estas lenguas están en riesgo inminente de extinguirse y no poseen los registros necesarios para su estudio tradicional.
No obstante, la implementación de este sistema enfrenta retos éticos y tecnológicos. Si bien la capacidad técnica para generar bases de datos masivas es real, el éxito del proceso está condicionado por la disponibilidad de información de alta calidad.
Obstáculos para el registro digital
Uno de los mayores impedimentos identificados por el proyecto es la aguda escasez de datos para alimentar los algoritmos. Según Meza Ruiz, gran parte de los archivos existentes están vinculados a expresiones musicales, dejando un vacío significativo en los registros del habla cotidiana. Esta carencia de lenguaje coloquial dificulta que la inteligencia artificial aprenda mediante ejemplos de uso real.
Este desequilibrio informativo restringe la representatividad de los idiomas y limita las posibilidades de lograr una preservación tecnológica efectiva.

En la actualidad, la presencia de estas lenguas en el entorno digital es sumamente limitada. Tomando como referencia datos de plataformas como Wikipedia, se evidencia la enorme brecha digital respecto a las lenguas predominantes:
- Náhuatl clásico: 4.272 artículos.
- Maya yucateco: 1.201 artículos.
- Náhuatl central: 224 artículos.
- Mixteco: 113 artículos.
- Hñahñu: 90 artículos.
- Purépecha: 12 artículos.
- Mixe del norte: 10 artículos.
El dilema ético y la función social
La investigación también ha sacado a la luz un conflicto ético de gran relevancia. Una cantidad considerable de documentos y textos escritos en lenguas indígenas están protegidos por derechos de autor. Esta situación obstaculiza la recopilación de datos para fines tecnológicos o académicos, creando una tensión entre el modelo de ciencia abierta y el respeto a los derechos morales y patrimoniales de las comunidades originarias.
A pesar de estos inconvenientes, la digitalización lingüística persigue un fin social trascendental que va más allá de lo cultural.

El desarrollo de una infraestructura digital robusta permitiría que los hablantes nativos tengan un acceso equitativo a servicios esenciales. Entre los beneficios directos se encuentran:
- Acceso a la salud y la justicia en su lengua materna.
- Mejoras en la educación personalizada.
- Fomento de la autonomía económica.
- Garantía de la transmisión del legado oral y escrito.
Para concluir, Meza Ruiz enfatiza que el reto inmediato es la construcción de un ecosistema que facilite la recolección y el procesamiento de datos específicos. Solo mediante este esfuerzo coordinado será viable salvaguardar los idiomas digitalmente, asegurando que el conocimiento indígena esté disponible para las próximas generaciones, ya sea en plataformas virtuales o aplicaciones inteligentes.
Fuente: Fuente