Una investigación de la UR identifica 76 términos exclusivos de la poesía que no estaban en diccionarios

Fuente: https://www.larioja.com/unirioja/investigacion-identifica-terminos-exclusivos-poesia-diccionarios-20250306153938-nt.html

El estudio automatizado ha clasificado 69.000 palabras en torno a 7.000 lemas a través de una base de datos que reúne todos los diccionarios de inglés antiguo disponibles hasta la fecha


Una investigación desarrollada en la Universidad de La Rioja (UR) ha identificado 76 compuestos que eran exclusivos de la poesía y que, además, no estaban recogidos en ningún diccionario. Esto permite ampliar el conocimiento sobre la riqueza del inglés antiguo y su evolución.
.
Esta es una de las conclusiones de la tesis doctoral de Yosra Hamdoun Bghiyel titulada The Lemmatisation of The York-Toronto-Helsinki Parsed Corpus of Old English Poetry with a Relational Database of Old English Dictionaries, por la que ha obtenido la calificación de sobresaliente 'cum laude'.
.
La tesis, desarrollada en el Departamento de Filologías Modernas -en el marco del programa de 682D Doctorado en Filología Inglesa (Real Decreto 99/2011)-, ha sido dirigida por los doctores de la Universidad de La Rioja Javier Martín Arista y Raquel Vea Escarza.
.
La investigación de Yosra Hamdoun Bghiyel se centra en el estudio del inglés antiguo, la lengua que se hablaba en las Islas Británicas entre los siglos VII y XI, a través de su poesía; por lo que para comprender mejor el inglés antiguo y cómo se usaban las palabras en su época se ha centrado en un proceso llamado lematización.
.
Este método permite agrupar diferentes formas de una palabra bajo una única forma base conocido como «lema». Por ejemplo, en español organizamos palabras como corriendo y corrí bajo la forma principal correr. Este proceso es esencial para analizar lenguas antiguas con gran variabilidad ortográfica y sin una estandarización clara.
.
Para aplicar este enfoque al estudio del inglés antiguo, la doctora por la Universidad de La Rioja ha desarrollado un método automatizado que clasifica y organiza las 69.000 palabras recogidas en la base de datos The York-Toronto-Helsinki Parsed Corpus of Old English Poetry. Esta metodología ha empleado herramientas digitales avanzadas para agrupar las 69.000 formas del YCOEP en torno a 7.000 lemas, utilizando una base de datos que reúne todos los diccionarios de inglés antiguo disponibles hasta la fecha.
.
De esta manera, durante el desarrollo de la tesis, la doctora ha logrado automatizar un porcentaje significativo de la lematización aunque el resto de palabras requirió un análisis manual más detallado. Durante este proceso se identificaron 76 términos exclusivos de la poesía, como que no habían sido registrados en diccionarios previos. Este descubrimiento ha logrado ampliar el conocimiento sobre la riqueza del inglés antiguo y su evolución.
.
Yosra Hamdoun Bghiyel realizó una estancia de seis meses en la Universidad de Toronto, sede del Dictionary of Old English (DOE), para verificar la precisión de su investigación. Al comparar nuestra investigación con este diccionario, se confirma que la poesía anglosajona contiene palabras y formas únicas que no se encuentran en la prosa de la época.
.
Esta investigación contribuye a una mejor comprensión del inglés antiguo y sienta las bases para el desarrollo de herramientas de procesamiento del lenguaje, útiles en el análisis de otras lenguas históricas. Además, al mejorar la forma en que organizamos y estudiamos textos antiguos, facilita futuras investigaciones en historia, filología y lingüística computacional. Estos avances representan un paso clave en el uso de la tecnología para estudiar y preservar las lenguas del pasado.
.
por La Rioja