Metodología para la población automática de ontologías. Aplicación en los dominios de medicina y turismo

  1. RUIZ MARTÍNEZ, Juana María
Dirigida por:
  1. Rodrigo Martínez Béjar Director/a
  2. Rafael Valencia García Director/a

Universidad de defensa: Universidad de Murcia

Fecha de defensa: 07 de febrero de 2012

Tribunal:
  1. María Piedad Fernández Toledo Presidente/a
  2. Dagoberto Castellanos Nieves Secretario
  3. Michael Geisler Vocal
  4. Jesualdo Tomás Fernández Breis Vocal
  5. Juan Miguel Gómez-Berbís Vocal

Tipo: Tesis

Teseo: 113962 DIALNET

Resumen

En esta tesis se proponen dos metodologías para la instanciación o población automática de ontologías abordando el desarrollo de la mismas desde una perspectiva lingüística y computacional. La primera metodología se basa en la distancia cotextual y la ganancia de conocimiento. Se parte de dos corpora, relativos al dominio del turismo, que se analizan desde un punto de vista discursivo. Los datos obtenidos se interpretan, de modo que la información que arroja el análisis se pueda utilizar como elemento de partida para la extracción de información textual de forma automática. En primer lugar se desarrollan una serie de patrones lingüísticos y listas de entidades nombradas, que se integran en la herramienta GATE. Una vez procesados los textos con esta herramienta, el resultado es un conjunto de anotaciones clasificadas como entidades nombradas. A continuación, la metodología propuesta calcula cuáles de esas entidades podrían ser individuos de la ontología, basándose en la distancia que las separa en el texto, por un lado, y en la cantidad de conocimiento que aportan a la ontología, por otro. La consistencia de la ontología se comprueba en la fase final mediante un razonador. La segunda metodología propuesta se basa en la instanciación de ontologías a partir de roles semánticos. La integración de diversos recursos ontológicos y lingüísticos es la base de esta metodología, en la que se combinan ontologías de alto nivel del dominio biomédico con frames semánticos extraídos de FrameNet. El resultado es un modelo ontológico, que permite la extracción de relaciones entre entidades en textos de carácter biomédico. Las entidades implicadas en dichas relaciones se convierten en candidatas a instancias de la ontología. Finalmente, un razonador comprueba la consistencia e infiere nuevas instancias, en función de los axiomas definidos. La validación de la metodología se lleva cabo mediante el mapeo del modelo ontológico con una ontología de dominio biomédico y la instanciación de la misma.