°C -
|

La Jornada

Últimas noticias
Anuncio
Anuncio

Algoritmo descifra de forma automática lenguas perdidas

Imagen
Encabezado por la profesora Regina Barzilay, el sistema se basa en varios principios sustentados en conocimientos de la lingüística histórica. Foto tomada del sitio www.regina.csail.mit.edu
22 de octubre de 2020 09:23
Jueves 22 de octubre de 2020. Madrid. Un nuevo algoritmo demostró ser capaz de descifrar automáticamente una lengua perdida, sin necesidad de conocimientos avanzados de su relación con otras.

El objetivo del equipo de investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del Instituto Tecnológico de Massachusetts (MIT, por sus siglas en inglés) es que el sistema pueda descifrar idiomas perdidos que han eludido a los lingüistas durante décadas, utilizando sólo unos pocos miles de palabras.

Encabezado por la profesora Regina Barzilay, el sistema se basa en varios principios sustentados en conocimientos de la lingüística histórica, como el hecho de que los idiomas por lo general sólo evolucionan de ciertas formas predecibles. Por ejemplo, si bien un idioma determinado rara vez agrega o elimina un sonido completo, es probable que se produzcan ciertas sustituciones de sonido. Una palabra con una p en el idioma principal puede cambiar a una b en el descendiente, pero el cambio a una k es menos probable debido a la brecha significativa de pronunciación.

Al incorporar éstas y otras limitaciones lingüísticas, Barzilay y el estudiante de doctorado del MIT Jiaming Luo desarrollaron un algoritmo de descifrado que puede manejar el vasto espacio de posibles transformaciones y la escasez de una señal de guía en la entrada.

Incrusta sonidos

El algoritmo aprende a incrustar los sonidos del lenguaje en un espacio multidimensional donde las diferencias en la pronunciación se reflejan en la distancia entre los vectores correspondientes. Este diseño les permite captar pautas pertinentes de cambio de lenguaje y expresarlos como restricciones computacionales. El modelo resultante puede segmentar palabras en un idioma antiguo y asignarlas a sus contrapartes en otro relacionado.

El proyecto se basa en un documento que Barzilay y Luo escribieron el año pasado donde descifraron las lenguas muertas ugarítico (lengua semítica) y lineal B (sistema de escritura usado para escribir el griego micénico) la última de las cuales ha tradado décadas en ser decodificada. Sin embargo, una diferencia clave con ese proyecto fue que el equipo sabía que estos idiomas estaban relacionados con las primeras formas del hebreo y el griego, respectivamente.

Con el nuevo sistema, el algoritmo infiere la relación entre los idiomas. Esta pregunta es uno de los mayores desafíos del desciframiento. En el caso de lineal B, se necesitaron varias décadas para descubrir el descendiente conocido correcto. Para el íbero, los estudiosos aún no pueden ponerse de acuerdo sobre el idioma relacionado: algunos defienden el euskera, mientras otros refutan esta hipótesis y afirman que el íbero no se relaciona con ningún idioma conocido.

El algoritmo propuesto puede evaluar la proximidad entre dos idiomas; de hecho, cuando se prueba en idiomas conocidos, incluso puede identificar con precisión familias de ellos. El equipo aplicó su algoritmo al íbero considerando al vasco, así como a los candidatos menos probables de las familias romance, germánica, turca y urálica.

Si bien el vasco y el latín estaban más cerca del íbero que otros, todavía eran demasiado diferentes para considerarlos relacionados.

México, en la ruta de lograr emisiones cero en 2060, afirma la ICM

El informe presentado en la COP29 señala que el país debe producir electricidad con fuentes no fósiles, elevar la energía eólica y solar.

Descubren el cráter más grande y antiguo de Venus

La región conocida como Haastte-Baad en dicho planeta y podría desentrañar etapas iniciales de la vida allí.

Nave espacial de carga Tianzhou-7 reingresa a la atmósfera

La mayoría de los componentes de la nave espacial se desintegraron durante el reingreso y una pequeña cantidad de sus restos cayó en aguas seguras fijadas con anticipación.
Anuncio