Formalization of concept-relatedness using ontologies: conceptual density
Laburpena
[ES]Los humanos decimos de forma natural el punto hasta el
que dos cosas cualquiera están relacionadas o no.
Denominamos medida de la naturaleza de la relación a
esa capacidad, es decir, la capacidad que mide la
fuerza que tiene la relación entre dos palabras. Para
poder formalizar y llevar a cabo la medida de la
naturaleza de la relación se necesitan recursos lexicales
estructurados. Las principales aportaciones de esta
tesis son las siguientes:
1. Formalización de la naturaleza de la relación entre palabras
y conceptos basados en el conocimiento.
2. Definición del método para enriquecer y fortalecer
los recursos lexicales estructurados extraídos de
diccionarios.
La primera aportación se ha concretado en la Densidad
Conceptual, que hemos realizado sobre la base de
conocimiento lexical WordNet, en inglés. Hemos explicado
las ventajas teóricas de nuestra formalización y
la hemos evaluado con dos tareas prácticas. Por un lado,
en la desambiguación de las palabras, hemos
desambiguado todos los nombres de un corpus público
en inglés. Hemos comparado la Densidad
Conceptual con otros dos métodos, logrando mejores
resultados. Por el otro, también la hemos aplicado a
la corrección automática de textos ingleses, pero
en ese caso con la ayuda de otras fuentes de
conocimientos, por ejemplo la gramática reductora, la
frecuencia de las palabras y las concurrencias. El
sistema que hemos llevado a cabo ha demostrado que es
posible escoger sugerencias de correcciones con
una gran precisión.
En cuanto a la segunda aportación, es sabido que el
conocimiento extraído de los diccionarios suele ser
limitado. Las jerarquías se construyen entre las palabras,
no entre los significados. Además, a las jerarquías
extraídas se les ha achacado ser pequeñas y de estructura
mediocre en la superficie. Con este trabajo
queremos probar que hay un modo de superar esas barreras,
accediendo a la base de conocimiento de una
lengua