Implementación de reglas de proyección conceptuales en el marco de la semántica profunda para la reutilización de bases de conocimiento enciclopédico

  1. María de los Llanos Carrión Varela
Supervised by:
  1. Ricardo Mairal Usón Director
  2. Carlos Periñán-Pascual Director

Defence university: UNED. Universidad Nacional de Educación a Distancia (España)

Year of defence: 2014

Committee:
  1. Francisco José Cortés Rodríguez Chair
  2. Ismael Iván Teomiro García Secretary
  3. María Beatriz Pérez Cabello de Alba Committee member
  4. Rocío Jiménez Briones Committee member
  5. Guadalupe Aguado de Cea Committee member

Type: Thesis

Abstract

La tesis doctoral realizada parte del trabajo desarrollado dentro del marco de la migración de datos entre diferentes modelos de conocimiento y herramientas de procesamiento del lenguaje natural (en adelante, PLN), así como del modelado de bases de conocimiento. Más concretamente, el trabajo se centra en la metodología y resultados de la representación conceptual del conocimiento episódico, como resultado del proceso de reutilización y proyección del conocimiento almacenado en otras bases de conocimiento, a FunGramKB (http://www.fungramkb.com), una base de conocimiento multilingüe y multipropósito. Dicha base de conocimiento se compone de módulos léxicos y conceptuales, siendo en estos últimos donde la tesis se ha desarrollado, especialmente en el módulo que contiene el conocimiento enciclopédico sobre entidades nombradas, denominado Onomasticón. Mediante el trabajo realizado, se pretende profundizar en la creación y descripción de una metodología que permite poblar de manera semi-automática dicho módulo, a través de la elaboración de reglas de proyección conceptuales que permiten desarrollar el contenido proposicional de cada constructo. Para ello, se ha escogido el concepto PLACE, identificado con la clase ¿Place¿ de la base de conocimiento DBpedia (http://dbpedia.org), repositorio construido a partir de la información de Wikipedia (http://www.wikipedia.org) y a raíz del cual se ha realizado la población semi-automática del Onomasticón. A este concepto PLACE se añade la creación de reglas en los dominios PERSON, WORK y ORGANISATION, por encontrarse entre los más numerosos y representativos dentro de esta herramienta enciclopédica. Tras el desarrollo y descripción de la metodología semi-automática para la creación de las reglas de proyección conceptuales, se extraen varias conclusiones. Entre ellas, destaca la enumeración de dos tipologías de reglas (semántica y formal) y las correspondencias que pueden establecerse entre ambas, las cuales llevan a la comprobación de la hipótesis de que los conceptos y/o propiedades cuyas reglas definitorias presentan una estructura análoga en la tipología de reglas pueden compartir, de la misma manera, una motivación semántica común, subyacente a las categorías ontológicas. Asimismo, existe un tercer objetivo en la tesis doctoral realizada, el cual consiste en determinar la aplicación que pueden tener los resultados obtenidos para resolver problemas lingüísticos que acucian al PLN, concretamente la referencia, la correferencia, la anáfora, la metáfora, la metonimia y la metaftonimia. A través de la muestra de varios ejemplos de cada fenómeno lingüístico, se pone de manifiesto la ayuda que la información contenida en el Onomasticón de FunGramKB puede aportar a la resolución exitosa de dichos problemas. Finalmente, se plantean las conclusiones derivadas del estudio completo y se muestran las futuras líneas de investigación que ofrece el trabajo ya realizado, como por ejemplo la utilización de la base de conocimiento FunGramKB como recurso lexicográfico multilingüe, así como su implementación en sistemas relacionados con la web semántica, la traducción automática, la extracción y recuperación de información, el análisis de sentimiento o la creación de agentes cognitivos, inter alia.