Metodología para la población automática de ontologías. Aplicación en los dominios de medicina y turismo

  1. RUIZ MARTÍNEZ, Juana María
Supervised by:
  1. Rodrigo Martínez Béjar Director
  2. Rafael Valencia García Director

Defence university: Universidad de Murcia

Fecha de defensa: 07 February 2012

Committee:
  1. María Piedad Fernández Toledo Chair
  2. Dagoberto Castellanos Nieves Secretary
  3. Michael Geisler Committee member
  4. Jesualdo Tomás Fernández Breis Committee member
  5. Juan Miguel Gómez-Berbís Committee member

Type: Thesis

Teseo: 113962 DIALNET

Abstract

En esta tesis se proponen dos metodologías para la instanciación o población automática de ontologías abordando el desarrollo de la mismas desde una perspectiva lingüística y computacional. La primera metodología se basa en la distancia cotextual y la ganancia de conocimiento. Se parte de dos corpora, relativos al dominio del turismo, que se analizan desde un punto de vista discursivo. Los datos obtenidos se interpretan, de modo que la información que arroja el análisis se pueda utilizar como elemento de partida para la extracción de información textual de forma automática. En primer lugar se desarrollan una serie de patrones lingüísticos y listas de entidades nombradas, que se integran en la herramienta GATE. Una vez procesados los textos con esta herramienta, el resultado es un conjunto de anotaciones clasificadas como entidades nombradas. A continuación, la metodología propuesta calcula cuáles de esas entidades podrían ser individuos de la ontología, basándose en la distancia que las separa en el texto, por un lado, y en la cantidad de conocimiento que aportan a la ontología, por otro. La consistencia de la ontología se comprueba en la fase final mediante un razonador. La segunda metodología propuesta se basa en la instanciación de ontologías a partir de roles semánticos. La integración de diversos recursos ontológicos y lingüísticos es la base de esta metodología, en la que se combinan ontologías de alto nivel del dominio biomédico con frames semánticos extraídos de FrameNet. El resultado es un modelo ontológico, que permite la extracción de relaciones entre entidades en textos de carácter biomédico. Las entidades implicadas en dichas relaciones se convierten en candidatas a instancias de la ontología. Finalmente, un razonador comprueba la consistencia e infiere nuevas instancias, en función de los axiomas definidos. La validación de la metodología se lleva cabo mediante el mapeo del modelo ontológico con una ontología de dominio biomédico y la instanciación de la misma.